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OM nucleic - nucleic search, using sw model 
Run on: 



March 5, 2005, 15:38:47 ; Search time 8644.89 Seconds 

(without alignments) 
12117.322 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg. 



. tgagtgctgaggccggccag 2752 



IDENTITY__NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 34239544 seqs, 19032134700 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



68479088 



Post-processing : 



Database : 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

EST:* 
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: gb_ 


estl: 


★ 
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: gb_ 


est2 : 
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: gb_ 


"htc:* 




4 


. gb_ 


est3 : 
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: gb_ 


_est4 : 
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: gb 


est5 : 


★ 
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: gb 


_est6: 


★ 
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: gb 


gssl : 




9 


: gb 


gss2 : 





Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
AY406491 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AY406491 2802 bp DNA linear GSS 15-DEC-2003 

Homo sapiens UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406491 
AY406491. 
GSS. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 2802) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F. 



GI:39762465 



(human) 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



f Kejariwal,A. 
Murphy, B. , 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2802) 

Clark, A. G., Glanowski , S . , Nielson,R., Thomas, P., Ke j ariwal , A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2802 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606 M 
<1. .>2802 
/gene="UNC5C n 
/locus_tag="HCM2575" 



ORIGIN 



Query Match 34.9%; 
Best Local Similarity 61.3%; 
Matches 1682; Conservative 



Score 960.2; DB 9 
Pred. No. 6.4e-192 
0; Mismatches 995 



Length 2802; 

Indels 69; Gaps 6; 



Qy 

Db 



57 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 116 

II II II I I I I I I II I I I I I I I I I III I 

66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 



Qy 

Db 



117 T GC CCAGCAGAGT GC CACC GTGGCCAAC C CAGT GC CT GGT GC CAACC CGGACCT GCT T C C 176 

II I I I I I I I III II I I I I I I I I I 

126 T GAT GACTTTTTT CATGAACTCCCAGAAACTTTT C CTT CT GAT C C AC CT GAGCCT CT GCC 185 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



177 



186 



237 



246 



297 



306 



357 



366 



C CACTT C CT GGT GGAGCCC GAGGAT GT GT ACAT C GT CAAGAACAAGCCAGT GCT GCT TGT 

1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 i 1 1 i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 

AC ATTT C CT T ATT GAGCCT GAAGAAGCTT AT AT T GT GAAGAAT AAGC CT GT GAAC CT GTA 

GTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCA 
II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

CT GT AAAGCAAGCC CTGCCACCCAGAT CT ATTT CAAGT GTAATAGT GAAT GGGTT CAT CA 

GGTGGACCACGTGAT CGAGCGCAGCACAGACGGGAGCAGT GGGCT GCCCACCAT GGAGGT 
I I I I I II I I III II I I I I I I I I I I I I I II 

GAAGGACCACAT AGT AGAT GAAAGAGT AGAT GAAACTT C C GGT CT CATT GT CCGGGAAGT 



236 



245 



296 



305 



356 



365 



416 



C C GCATT AATGT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT ACT GGT G 
I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGCAT T GAGATT T C GCGCCAGCAAGT GGAAGAACT CTTT GGAC CT GAAGATT ACT GGT G 425 



417 CCAGTGC GT GGCAT GGAGCT CCT CGGGCAC CAC CAAGAGT C AGAAGGCCT ACAT C C GCAT 476 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
426 C CAGT GTGTGGCCT GGAGCT CCGCGGGTACCACAAAGAGCCGGAAGGCGTATGTGC GCAT 485 



Qy 477 AGC CAGATT GC GCAAGAACTT C GAGC AGGAGC C GCT GGC CAAG GAGGT GT C C CT 530 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 486 T GC ATNNNNNNNNNNNCGGAAGAC AT TT GAGC AGGAACC CCT AGGAAAGGAAGT GT CTTT 545 

Qy 531 GGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGA 590 

1 1 1 1 1 1 1 ii i ii r ii it 1 1 1 1 1 ii ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 546 GGAACAGGAAGT CTT ACT C CAGT GT C GAC C ACCT GAAGGGAT CC C AGT GGCT GAGGT GGA 605 

Qy 591 GTGGCT C CGGAAC GAGGAC CT GGT GGACC CGT CCCT GGACC C CAAT GT AT ACATC ACGC G 650 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

Db 606 ATGGTTGAAAAAT GAAGACATAATT GATCCCGTTGAAGATCGGAATTTTTATATT ACTAT 665 

Qy 651 GGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 710 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I 

Db 666 T GAT CACAAC CT CAT CATAAAGCAGGCC CGACT CT CT GAT ACT GCAAATT ACACCT GT GT 725 

Qy 711 GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 770 

I I I I I I I I I I I I I I I II I III I I I I I I I I I I I I I I I I 

Db 726 T GCCAAAAACATT GTT GC CAAGAGGAAAAGT ACAACT GCCACT GT CAT AGT CT AT GT CAA 785 

Qy 771 CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 830 

I I I I I I Mill II I I I I I I I I I I I II II II I I I I I I I I I I II II I 

Db 786 CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

Qy 831 GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 8 90 

I I I I I I I I I III I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 
Db 84 6 T CAGAAACGT ACAAGGACTT GT AC CAACCCGGCACCACT CAAT GGGGGT GCCTT CT GT GA 905 

Qy 891 GGGGCAGAAT GT C CAGAAAACAGCCT GCGCCACCCT GT GCC CAGT AGACGGCAGCT GGAG 950 

I I I I I I I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 906 AGGGCAGAGTGT GCAGAAAATAGCCT GTACTACGTTAT GCCCAGTGGAT GGCAGGT GGAC 965 

Qy 951 CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 1010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 966 GCCATGGAGCAAGTGGT CTACTT GT GGAACTGAGT GCACCCACT GGC GCAGGAGGGAGT G 1025 

Qy 1011 CTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCG 1070 

' I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I II 
Db 1026 CACGGCGCCAGCCCCCAAGAATGGAGGCAAGGACTGCGACGGCCTCGTCTTGCAATCCAA 1085 

Qy 1071 CAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTA 1130 

I I I I I I I II I I I I I I I I I I I I I II I N M M M Mill 
Db 1086 GAACTGCACT GAT GGGCTTTGCAT GCAGACT GCT CCT GATT C AGATGAT GTT GCT CT CTA 1145 

Qy 1131 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1187 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1146 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

Qy 1188 CGT TT AT TGC CGGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACT C GT CCATT CT C AC 1247 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1206 T GTGTATCGGAAGAATCAT CGTGACTTTGAGT CAGATATTATTGACT CTT CGGCACTCAA 1265 

Qy 1248 CT CAGGCTT C CAGCCCGT CAGCAT CAAGC C C AGCAAAGCAGACAAC C CCC AT CT GCT CAC 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1266 T GGGGGCTT T CAGCCT GT GAACAT CAAG GCAGCAAGACAAGAT CT GCT GGC 1316 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1308 CAT CCAGCCGGACCT CAGC AC CAC C ACCAC CAC CT AC CAGGGCAGT CT CTGT CC C CGGCA 1367 

II I I I I I I I I I I i I III III II I I I I I I I I I I I 
1317 TGT ACCCCCAGACCT CAC GT CAGCT GC AGC CAT GT AC AGAGGACCT GT CT AT GC CCT GCA 1376 

1368 GGATG GGC C CAGC C C CAAGTT C CAGCT CACCAAT GGGCACCTGCTCAGCCC 1418 

III II I I I I I I III III I I I I I I I I I I I I I I I 

1377 TGACGT CT C AGACAAAAT C C CAAT GAC CAACT CT CCAATT CT GGAT CCACT GC C CAACCT 1436 

1419 CCT GGGT GGC GGC CGC CACAC ACT GCAC CAC AGCTCT CC CAC CTCT GAGGC C GAGGAGTT 1478 

I I I I I I I I I I I III I I I I I I 

1437 GAAAAT CAAAGT GT ACAACAC CT C AGGT GCT GT CAC C CCC CAAGAT GACCT CT CT GAGTT 1496 



1479 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 

III II III I I II I I I II I I I I I I I 

1497 T ACGT CCAAGCT GTCC CCT CAGAT GAC CCAGT C GTT GTT GGAGAAT GAAGC C CT CAGCCT 

1539 GA CCTATGGGACCTTCAA 

II I I I I I I I I I I I I 

1557 GAAGAACCAGAGT CT AGCAAGGCAGACT GAT CCATC CT GT AC CGCATT T GGC AGCTT CAA 



1538 



1556 



1556 



1616~ 



1557 



CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1617 CTCGCTGGGAGGTCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 167 6 

1617 TGC CAT AC CCC GAGGGAAGAT CT AT GAGAT CT AC CT C ACGCT GC ACAAGC CGGAAGAC GT 1676 

I I I I I I I II I I I I I I I I I I I I I I I III I MM I III I 
1677 GGCCATTCCCCAAGGGAGAGTCTACGAAATGTAT GT GACTGTACACAGGAAAGAAACTAT 



1736 



1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I II I I I II I I I II I I I II Ml M I II I M I II I I I I I II 
1737 GAGGCCAC C CATGGAT GACT CT CAGACACTTTT GAC C CCT GT GGT GAGCTGT GGGCCC CC 1796 

1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

III I I II M I I I II II I I I I M I I I II II I II I I I I I I II I I I 
1797 AGGAGCTCT GCT CACCCGCCCAGT C GT C CT CACT AT GCAT CACT GC GC AGACCCCAAT AC 1856 

1797 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 

II I I I I I II II I I I I I I I I I II I I I II I II II I I I I I 

1857 CGAGGACT GGAAAAT ACT GCT CAAGAACC AGGC AGCACAGGGAC AGTGGGAGGAT GT GGT 1916 

1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCT ACT ACT GC CAGCT GGAGGCCAGTGCCTG 1916 

I I I I II I II III I I M I II I I I I I I I I t II I II I I 

1917 GGT GGT CGGGGAGGAAAACTT CAC CACC CC CT GCT ACATT CAGCT GGAT GCAGAGGCCT G 1976 

1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1976 

I I I I I I M I I II I I I II II I I I I II I I I I I I II II I II 

1977 CCACATCCT CACAGAGAACCTCAGCACCTACGCCCT GGTAGGACATTCCACCACCAAAGC 2036 

1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I II I I I I I I I I I I I I I II I I I II I II II I I I I I II I I I II I I I 

2037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 

2037 CAACAT CC GGGT CT ACT GC CT GCAT GACAC C CAC GAT GC ACT CAAGGAGGT GGT GC AGCT 2096 

II I I I I II I II II I II III I I I I II II I I I I III II I II II I I I I. II 
2097 CAGCAT CC GAGT CT ACT GT CT GGAT GAC AC CCAGGAT GCCCT GAAGGAAATTT T AC AT CT 2156 

2097 GGAGAAGCAGCT GGGGGGACAGCT GAT CC AGGAG C C ACGGGT C CT GCACT T CAAGGAC AG 2156 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2157 TGAGAGACAGAT GGGAGGACAGCT C CT AGAAGAAC CTAAGGCT CT T CAT TTT AAAG GCAG 2216 



Qy 2157 TT ACC ACAAC CT GCGCCT AT C CAT C CAC GAT GT GC CC AGCT CCCT GTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2217 CACC CACAAC CT GC GCCT GT CAATT CACGAT ATCGCC C ATT C CCT CT GGAAGAGCAAAT T 2276 

Qy 2217 CCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTT 2276 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III 
Db 2277 GCTGGCTAAATATCAGGAAATTCCATTTTACCATGTTTGGAGTGGATCTCAAAGAAACCT 2336 



Qy 2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2337 GCACT GCAC CTT CACT CTGGAAAGATTT AGCCT GAACACAGT GGAGCT GGTT T GCAAACT 2396 



Qy 2337 GT GGGT GT GGC AGGT GGAGGGCGAC GGGCAGAGCT T CAGCAT CAACTT CAACATCACCAA 2396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2397 CTGTGTGCGGCAGGTGGAAGGAGAAGGGCAGATCTTCCAGCTCAACTGCACCGTGTCAGA 2456 

Qy 2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I II I I I I I I I I I II I I I I I 

Db 2457 GGAACCTACT GGCAT CGATTTGC CGCT GCT GGAT C CT GCGAACAC CAT CAC CACGGT CAC 2516 

Qy 2457 GGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGA 2516 

II I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I II I I I I I 

Db 2517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 2576 

Qy 2517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2576 

I I I I I I I I I MINIMI I I I I I I I I I I II I I I I I II I I I 

Db 2577 TGCCCCCCAGACGAGAGGCCATGACTGGAGGATGCTGGCCCATAAGCTGAACCTGGACAG 2636 

Qy 2577 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2636 

I II I I I II I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I 
Db 2637 GTACTTGAATTACTTTGCCACCAAATCCAGCCCAACTGGCGTAATCCTGGATCTTTGGGA 2696 

Qy 2637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 

I I I I I I I I I II I I I I I I I I I I I I I II II II I III I I I I I I 
Db 2697 AGC ACAGAACTT CCCAGAT GGAAAC CT GAGCATGCT GGCAGCT GT CTT GGAAGAAATGGG 2756 



Qy 2697 CCAGCCAGAC GCTGGC CTCTT CACAGT GTC GGAGGCT GAGT GCT GA 2742 

I I I I I III II I I I I III I I 
Db 2757 AAGACAT GAAACGGTGGT GT CCT T AGCAGCAGAAGGGC AGT ATTAA 2802 



RESULT '2 
AY406493 
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DEFINITION 

ACCESSION 
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REFERENCE 



AY406493 2791 bp DNA linear GSS 15-DEC-2003 

Mus musculus UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406493 

AY406493 .1 GI : 39762467 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 
1 (bases 1 to 2791) 



AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Clark, A. G., Glanowski , S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B . , 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2791) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2791 

/organism="Mus musculus" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 10090" 

<1. .>2791 

/gene="UNC5C" 

/ lo cus_t ag= " HCM2 575" 



ORIGIN 



Query Match 34.5%; Score 950.4; DB 9 

Best Local Similarity 62.3%; Pred. No. 7.5e-190 
Matches 1653; Conservative 0; Mismatches 921 



Length 2791; 
Indels 80; Gaps 



7; 



Qy 

Db 



149 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

III III Mill. I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
158 TT CCAT CT GACC CACCTGAGC CAT T GCCACACTT C CT CAT T GAGC C C GAGGAAGCTT ACA 217 



Qy 

Db 

Qy 

Db 



209 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 268 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

218 TT GTGAAGAACAAGC CTGT GAAC CTGT ATT GTAAAGC CAGC CCT GC CAC C CAGAT CT ACT 277 

269 T CAAGTGCAAC GGGGAGT GGGT GC GCCAGGT GGACCAC GT GAT C GAGC GC AGCACAGAC G 328 

I II I I I I I I I I I I I I I I I I I I III I I I I I I I I I III II I I I I 

278 TCAAGTGCAACAGCGAGTGGGTTCATCAGAAGGACCACGTAGTAGACGAGAGAGTAGATG 337 



Qy 

Db 

Qy 

Db 

Qy 
Db 



329 GGAGCAGTGGGCT GCCCACCAT GGAGGTC CGC AT T AAT GT CT CAAGGCAGCAGGT C GAGA 388 

II I I I I I I II II I I I I I I I I I I I I I I II I I I I II 

338 AAACCT CT GGT CTAATT GT GAGAGAAGT GAGCATT GAGATTT C ACGCCAGCAGGT GGAGG 397 

389 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 44 8 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
398 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 457 



449 



502 



C CAAGAGT CAGAAGGC CT ACAT CC GC AT AGCCAG ATT GCGCAAGAACTTC GAGC 

I I I I I I I I I I I I I I I I I I I I III I I , 11.11 M il I I I I I I I 

458 CGAAGAGT C GGAAGGCAT ACGT GCGCATT GCGTT T C CAGAT CT GC GGAAGACATT C GAGC 517 



Qy 



503 AGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCAC 562 



1 1 1 1 II III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II I II II 1 1 1 1 

518 AGGAACCCTT GGGAAAGGAAGT GT CCT T GGAGCAGGAAGTCTTACT C CAGT GT C GGCCAC 577 

563 CGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGT 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

578 CTGAAGGGATCC GTAGAAT GGCT AAAGAAT GAAGAC ATAAT T GAT CCT G 626 

623 CCCTGGACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCC 682 

I III II I I I I I I I II I I I I I I I I I I I I I I I I I I 

627 CTGAAGATCGGAACTTTTATATTACTATCGATCACAACCTGATCATCAAGCAAGCCCGAC 686 

683 TTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCG 742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . I III 

687 T CT CAGAT ACAGCAAAT T AT AC CT GT GTT GC CAAAAAT ATT GTT GC CAAGAGAAAAAGCA 746 

743 CCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCG 802 

II I II I I I I I I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I I 

747 C CACAGC CACTGT CAT CGT GT AT GTTAATGGT GGCT GGT CCACCT GGAC AGAGT GGT CT G 806 

803 TCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGG 862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
807 T GT GTAACAGCC GCT GT GGGC GAGGAT AT C AGAAACGCACAAGAACCT GC AC CAACCCAG 866 

863 CGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCA 922 

I II I I I I I II II II I I II I I I I I I I I I I I I III I I I I I I I III III I I 
867 C CC CACT CAATGGTGGGGCCT T CT GT GAGGGGCAGAGT GT GCAGAAAAT AGC AT GCACT A 926 

923 CCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGG 982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
927 CGTT ATGT C CAGT GGAT GGT AGGT GGACTT CAT GGAGCAAAT GGTCAAC CT GT GGGACT G 986 

983 ACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGG 1042 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III 
987 AAT GCAC CCACT GGC GCAGGAG GGAGT GT ACAGC AC CAGCC C CCAAGAAC GGGGGTAAGG 1046 

1043 AGT GCCAGGGCACTGACCT GGACAC C CGCAACT GT ACCAGT GAC CT CT GT GT ACAC AGT G 1102 

I I I I I I I I I I I I II I I I II I I II I I I I III II 
1047 ACTGTGATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGCTG 1106 

1103 CTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCC 1159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1107 CTCCTGACTCAGATGATGTGGCTCTCTACGTGGGGATTGTGATCGCTGTAACAGTCTGTC 1166 

1160 TGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACT 1219 

III I I I I I I I I I I I I I I I I I I I I I I I 

' 1167 TGGCGATCACTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGT 1226 

1220 CAGATGT GGC TGACT C GT C CAT T CT CAC CT C AGGCTT CC AGC CCGT CAGCAT CAAGCCCA 1279 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1227 CT GACAT CATTGACT CCT CAGC ACT CAAT GGCGGCTTT C AGCCT GTGAACAT CAAG 1282 

1280 GCAAAGCAGACAACCCCCAT CT GCT CAC CATCCAGC CG GAC CTC AGCAC CAC CAC CAC C A 1339 

Mill I I I I I I I I III I I I I I I I I I I I I I III 
1283 GCTGCCAGACAAGATCTCCTGGCTGTCCCCCCTGACCTCACCTCAGCTGCAGCCA 1337 

1340 CCTACCAGGGCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCT 1394 

III III I I I I I I I I I I I I I I II I I I I II III II 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1338 T GT ACAGGGGAC CT GTCT AT GCT CT GCAT GATGT CT CAGACAAAAT CC CAATGACCAACT 1397 

1395 CACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTC 1454 

I I I I I I I I I I I I I I I I I I I III 

1398 CT CCAAT T CT GGACC CACTAC CCAACTT GAAAAT CAAAGT GTACAAC AGCT CAGGT GCT G 14 57 

1455 TCCCACCTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1498 

I I I I I It * III I II I I I I III I I II III 

1458 T C ACT CCT C AGGAT GACCTT GC CGAGTT CT CAT C CAAACT GT CACCC C AGATGACC C AGT 1517 

1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCA 1528 

I I I I I I I I I I I II 

1518 C CTT GCT AGAGAAT GAGGCC CT TAAC CT GAAGAACCAGAGC CT C GCAAGAC AGACT GAC C 1577 

1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1588 

I I II I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 
1578 CAT CCT GCACAGCATTTGGTACCTTCAACTCTCTTGGGGGTCACCT CATC ATT CCTAATT 1637 

1589 CAGGTATCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCT 164 8 

MM I I M I II I I II I I I I II II II I I I II II I I II I II I 
1638 CAGGAGTAAGCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGT 1697 

1649 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 1708 

I III I II I I I II I I I I II I I I I I I I M I I M M I M I 

1698 ATGTGACT GTACACAGGAAAGAAAATAT GAGGCCCCCCATGGAAGACT CTCAGACCCTAC 1757 

1709 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1768 

II II I I I II I I I II I I I II I II I I I M I I I M I I I I I II I II I 

1758 TTACCCCTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCA 1817 

1769 CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 1828 

II II I I I I I I I I II I I I II I I II Mill II I I I I I I I I III 
1818 CTCTGCATCACTGTGCAGACCCCAGCACCGAGGACTGGAAGATCCAGCTCAAAAACCAGG 1877 

1829 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 1888 

I I I I I I I I II II I I I I II I II I I I I M II II II 
1878 CAGT GCAGGGACAAT GGGAGGATGTT GT GGTGGTT GGGGAGGAGAACT T CACAACC CC CT 1937 

1889 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 194 8 

III I II II M I I I II II I I II II I I II I I I I I II I I 

1938 GTTACATTCAGCTGGAT GCAGAGGCTT GCCATATCCTCACAGAGAACCTCAGTACCTATG 1997 

1949 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 2008 

II II I II II I I I I III M I I I I II I I II M I I I II I I I I I 
1998 CCCTGGTTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTG 2057 

2009 CGC C GGT GGC CT GCAC CT CC CT CGAGT ACAAC AT C C GGGT CTACT GC CT GCAT GACAC C C 2068 

III I I I I I I I I I I I M II II I I II I II II I II I II I I I I I I II I I 
2058 GGCCCCTCTGCTGCTCTTCCCTGGAGTACAGCATTAGAGTCTACTGCCTGGATGACACAC 2117 

2069 AC GAT GCACT CAAGGAGGTGGTGCAGCT GGAGAAGCAGCT GGGGGGAC AGCTGATC CAGG 2128 

I I I I I I I I I I I II I I I I I II II I II I M I I II II I I I I II I II 
2118 AGGATGCCCTGAAGGAAGTT CTACAACT GGAGAGGCAAATGGGAGGACAGCTCCTAGAAG 2177 

2129 AGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATG 2188 

I II II II II II II I Ml II I I II I I M II II I II II II II 
2178 AACCCAAGGCTCTTCATTTTAAAGGCAGCATCCACAACCTGCGCCTGTCTATTCATGACA 2237 



Qy 

Db 



2189 
2238 



TGC CCAGCT CC CT GT GGAAGAGTAAGCT C CT T GT CAGCT ACCAGGAGAT C CC CT T T TAT C 
I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 
TCGCCCATTCCCTCTGGAAGAGCAAATTGCTGGCTAAGTATCAGGAAATTCCATTTTACC 



2248 
2297 



Qy 2249 ACATCT GGAAT GGCACGCAGC GGT ACT T GCACT GCAC CTT CAC CCT GGAGC GT GT CAGCC 2308 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 2298 ACATCT GGAGT GGCT CT CAAAGAAAC CT C CACT GCAC CTT CACTCT GGAAAGACT CAGCC 2357 

Qy 2309 CCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGA 2368 

I I I I I I I I I I I I I I I I I II I I I II I I II I II II I I I I I I I I I 

Db 2358 TAAACACAGT GGAACT GGTT T GCAAACT CT GTGT GC GGCAGGTTGAAGGAGAAGGGCAGA 2417 

Qy 2369 GCTT CAGCAT CAACTT CAACAT CAC CAAGGAC ACAAGGT T T GCTGAGCT GCT GGCT CT GG 2428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2418 TCTTC CAGCT CAACT GTACT GT GT CAGAGGAACCT ACTGGCAT CGACT T AC CT CT C CT GG 2477 

Qy 2429 AGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCA 2488 

I II III I I I I I I I I I I I I I I I I I I I III I 

Db 2478 AC CCT GCTAGT ACC AT CAC CACT GT CACC GGACCAAGT GCTTT CAGC ATT C CT CT CC CT A 2537 

Qy 2489 TTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGA 2548 

I I I I I I I I I I I I I I I I I I I I I III I III I I I I I I I I I 

Db 2538 TCCGGCAGAAGCTATGCAGCAGCCTGGATGCCCCTCAAACAAGAGGCCATGACTGGAGGA 2597 

Qy 2549 CT CT GGCC CAGAAACT C CACCT GGACAGC CAT CT CAGCTT CTT TGCCT CCAAG CC CAGC C 2608 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2598 TGCTGGCCCATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCC 2657 

Qy 2609 CCACAGCCAT GAT C CT CAACCT GT GGGAGGC GCGGCACTT CCC CAACGGCAAC CT CAGCC 2668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2658 CAACT GGCGTAAT CCT GGATCTTT GGGAAGCACAGAACTTCCCAGAT GGAAACCTGAGCA 2717 

Qy 2669 AGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGG 2728 

MINIMI Ml I I I I I I I II II III I II 

Db 2718 TGCT GGCAGCC GTCCT GGAAGAAAT GGGAAGACAT GAGACAGT GGT GT CCTT GGCAGCAG 2777 

Qy 2729 AGGCT GAGTGCTGA 2742 

II III III 

Db 2778 AAGGACAGTATTGA 2791 
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AK031655 3790 bp mRNA linear HTC 03-APR-2004 

Mus musculus 13 days embryo male testis cDNA, RIKEN full-length 
enriched library, clone : 6030473H24 product:unc5 homolog (C. 
elegans) 3, full insert sequence. 
AK031655 

AK031655.1 GI: 26327502 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 



Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus. 



TITLE 
JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y . 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M. , 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine, T . , Harada, A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3790) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W . , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K. , Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki,D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi , F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16-JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc. riken . jp, 
URL:http: //genome. gsc. riken.jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 



COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URLrhttp: //genome . gsc . riken . jp/ 
URLrhttp: //fantom.gsc. riken. jp/ . 
FEATURES Location/Qualifiers 
source 1. .3790 

/organism="Mus rausculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB: 6030473H24" 

/db_xref="taxonr 10090" 

/clone="6030473H24" 

/sex="male" 

/ tissue_type="testis " 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="13 days embryo" 
CDS 118. .2970 

/note="unnamed protein product; putative 

unc5 homolog (C. elegans) 3 (MGD | MGI : 1095412, 

GB|NM_009472, evidence: BLASTN, 99%, match=464) " 

/codon_start=l 

/protein_id="BAC27495.1" 

/db_xref="GI : 26327503" 

/translation="MRKGLRATAARCGLGIGYLLQMLVLPALALLSASGTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHVVDERVDETSGLIVREVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEDIIDPAEDRNFYI 
TIDHNLIIKQARLSDTANYTCVAKNIVAKRKSTTATVIVYWGGWSTWTEWSVCNSRC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQGFIYPISTEHRPQNEYGFSSAPD 
SDDVALYVGIVIAVTVCLAITWVALFVYRKNHRDFESDI I DS SALNGGFQPVNI KAA 
RQDLIAWPDLTSAAAMYRGPWALHDVSDKIPMTNSPILDPLPNLKIKVTNSSGAW 
PQDDLAEFSSKLSPQMTQSLLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLIIPN 
SGVSLLIPAGAIPQGRVYEMYVTVHRKENMRPPMEDSQTLLTPWSCGPPGALLTRPV 
ILTLHHCADPSTEDWKIQLKNQAVQGQWEDVWVGEENFTTPCYIQLDAEACHILTEN 
LSTYALVGQSTTKAAAKRLKLAIFGPLCCSSLEYSIRVYCLDDTQDALKEVLQLERQM 
GGQLLEEPKALRFKGSIHNLRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHC 
TFTLERLSLNTVELVCKLCVRQVEGEGQIFQLNCTVSEEPTGIDLPLLDPASTITTVT 
GPSAFSIPLPIRQKLCSSLDAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDL 
WEAQNFPDGNLSMIJ\AVXEEMGRHETvVYLAAEGQY" 

ORIGIN 

Query Match 33.6%; Score 923.4; DB 3; Length 3790; 

Best Local Similarity 61.3%; Pred. No. 3.9e-184; 

Matches 1659; Conservative 0; Mismatches 926; Indels 120; Gaps 6; 

Qy 149 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

III III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 275 TTC CAT CTGACC CACCT GAGC C ATT GCC AC ACTT C CT C ATT GAGCCC GAGGAAGCTT ACA 334 

Qy 209 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 268 

I II I I I I I I I I I I I III II II II III II I I I I I I I I I I I I II 

Db 335 TTGTGAAGAACAAGCCTGTGAACCTGTATTGTAAAGCCAGCCCTGCCACCCAGATCTACT 394 



269 T CAAGT GCAACGGGGAGT GGGT GC GC CAGGTG GAC CAC GT GAT C GAG CGCAGC ACAGAC G 328 

II I I I I I I I I I I I I I I I I I I I III I I I I I I I I I III II I I I I 

395 T CAAGT GCAACAGC GAGT GGGTT C AT CAGAAGGAC CAC GT AGT AGACGAGAGAGT AGAT G 454 

329 GGAGC AGT GGGCT GC C CAC CAT GGAGGT C CGCATT AAT GT CTCAAGGCAGCAGGT C GAGA 388 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

455 AAACCTCT GGT CT AATT GT GAGAGAAGT GAGCATT GAGATTT C AC GCCAGCAGGT GGAGG 514 

389 AGGTGTTC GGGCT GGAGGAAT ACT GGT GCCAGTGCGTGGCATGGAGCTCCTCGGGC AC CA 44 8 

I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
515 AACT GTT T GGGC CT GAAGATT ACT GGT GC CAGT GT GT GGC CT GGAGCT CAGCAGGCACT A 574 

449 CCAAGAGT CAGAAGGCCT ACAT C CGCAT AGCCAGATT GCGCAAGAACTT C GAGC AGGAGC 508 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

575 CGAAGAGTCGGAAGGCAT ACGT GCGCATT GCGTAT CT GCGGAAGACATTCGAGCAGGAAC 634 

509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I III I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
635 CCTT GGGAAAGGAAGT GT C CT T GGAGCAGGAAGTCTT ACT CCAGT GT CGGC C AC CTGAAG 694 

569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

695 GGAT C C CAGT GGCT GAGGT AGAAT GGCT AAAGAAT GAAGACAT AAT T GAT C CT GCT GAAG 754 

629 AC C C CAAT GT AT ACAT CAC GC GGGAGCAC AGC CT GGT GGT GCGACAGGC CCGCCT TGCT G 688 

II II I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

755 AT CGGAACTTTTATATT ACTAT CGAT C ACAAC CT GAT CAT CAAGC AAGC CCGACT CT CAG 814 

689 ACACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCG 74 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

815 AT ACAGCAAAT T ATAC CT GT GTT GCCAAAAAT ATT GTT GC CAAGAGAAAAAGCAC CACAG 874 

749 CTGCTGTCATCGTCTACGTGAACGGT GGGT GGT CGACGTGGACCGAGTGGTCCGTCTGCA 808 

I I I II I I I I I I II II II I I I I I II I I I II I I I I I I I I I I I I I II II I 
875 CCACT GT CAT C GT GT ATGTTAAT GGT GGCT GGT C CAC CTGGACAGAGT GGT CTGT GT GT A 934 

809 GCGCCAGCTGT GGGC GC GGCT GGCAGAAAC GGAGC C GGAGCT GCACCAACCC GGC GCCTC 868 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
935 ACAGCCGCTGT GGGC GAGGAT ATCAGAAACGC ACAAGAAC CT GCAC CAACCCAGCCC C AC 994 

869 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 928 

I I I I II II II I I I I I I I I I I I I I II I I I I I I I I I I I III III I II I I 
995 T CAAT GGT GGGGC CT TCT GTGAGGGGCAGAGT GTGCAGAAAAT AGCAT GCACTAC GTT AT 1054 

929 GC C CAGT AGACGGCAGCT GGAGC C CGT GGAGCAAGT GGTCGGCCT GT GGGCT GGACT GCA 988 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I. 
105 5 GTCCAGT GGAT GGT AGGT GGACT T CAT GGAGCAAAT GGTCAACCT GT GGGACTGAATGCA 1114 

989 CCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCC 1048 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1115 CC CACTGGCGCAGGAGGGAGT GT AC AGCACCAGC C C C CAAGAAC GGGGGTAAGGACT GT G 1174 

1049 AGGGC ACT GACCT GGAC ACCC GCAACT GT AC CAGT GACCT CTGT GT ACACAG 1100 

I I I I I I I I I II I I I I I I I II I I I I III I 
1175 AT GGC CT GGTCCT C CAAT CCAAGAACT GC ACT GAT GGGCT GTGCAT GC AGGGAT T C ATTT 1234 



Qy 1101 TGCTTCTGGCC 1111 

I I I I III I 

Db 1235 AC CCCATTT CAACT GAGCACAGACCCC AGAATGAAT AT GGATT TT CT T CT GCT C CT GACT 1294 

Qy 1112 CTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGC 1168 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1295 CAGATGATGTGGCTCTCTACGTGGGGATTGTGATCGCTGTAACAGTCTGTCTGGCGATCA 1354 

Qy 1169 TGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGG 1228 

I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1355 CTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGTCTGACATCA 1414 

Qy 1229 CT GACT CGT C CATT CT CAC CT CAGGCTT CC AGCC CGT CAGCAT CAAGC C CAGCAAAGCAG 1288 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1415 TT GACT CCTCAGCACTCAATGGCGGCTTTCAGCCT GT GAACAT CAAG GCTG 14 65 

Qy 1289 ACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGG 1348 

II I I I I I I I I III I I I I I I I I I I I I I III III II 

Db 1466 CCAGACAAGAT CT C CT GGCT GT C C C C CCTGACCT CAC CT C AGCTGCAGCCAT GT ACAGGG 1525 

Qy 1349 GCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAATGG 1403 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1526 GAC CT GT CT AT GCT CT GCAT GAT GT CT CAGACAAAAT CCCAAT GAC CAACT CT CCAATT C 1585 

Qy 1404 GCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTC 1463 

I III III I I I I I I I I I I I I I I I I 

Db 1586 TGGAC CC ACT AC CCAACT T GAAAAT CAAAGT GT ACAACAGCT CAGGTGCT GT CACT C CT C 1645 

Qy 14 64 TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1498 

III I I I I I I I III I I I I III 

Db 1646 AGGAT GAC CTT GC C GAGT TCT C AT CCAAACT GT CAC CCCAGAT GAC C CAGT C CT T GCT AG 1705 

Qy 1499 AGAACT ACTT CC GCT C CCT GC C CC GAGGC AC CAGCAACA 1537 

I I I I I I I I I I I III III 

Db 1706 AGAATGAGGCCCTTAACCTGAAGAACCAGAGCCTCGCAAGACAGACTGACCCATCCTGCA 1765 

Qy 1538 TGACCT AT GGGAC CTT CAACTT C CT C GGGGGCC GGCT GAT GAT CC CTAAT AC AGGT AT CA 1597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1766 CAGCATTTGGTACCTTCAACTCTCTTGGGGGTCACCTCATCATTCCTAATTCAGGAGTAA 1825 

Qy 1598 GCCTC CTCAT C CCCCCAGAT GCC AT AC CCC GAGGGAAGAT CT AT GAGAT CT AC CT C AC GC 1657 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1826 GCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGACTG 1885 

Qy 1658 TGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCA 1717 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 18 86 TACACAGGAAAGAAAATAT GAGGCCCCCCATGGAAGACT CTCAGACCCTACTTACCCCTG 1945 

Qy 1718 TCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACC 1777 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1946 TGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGCATC 2005 

Qy 1778 ACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGG 1837 

I Mill II IN III I II Mill || I II I II I I I II I III 
Db 2006 ACT GT GCAGACC CCAGCACC GAGGACT GGAAGAT CCAGCT CAAAAACC AGGCAGT GC AGG 2065 



Qy 



1838 GCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCC 1897 



I I I I I I I I I I I I II I I I I I I I I I II MM III I 

2066 GACAATGGGAGGATGTTGTGGTGGTTGGGGAGGAGAACTTCACAACCCCCTGTTACATTC 2125 

1898 AGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGG 1957 

I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I 

2126 AGCT GGAT GC AGAGGCTT GCCAT ATC CT CACAGAGAAC CT CAGT ACCT AT GC CCT GGTT G 2185 

1958 GAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGG 2017 

I I I I I III I I I I M I M M I I 1 I I I I I I I I M M I I 

2186 GGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCCTCT 2245 

2018 CCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCAC 2077 

I I I I I II II I I I I I II I III I II II I I I I I II I I I I I I I I II II I I I I 
2246 GCT GCT CTT CC CT GGAGT ACAGCATT AGAGT CT ACT GCCT GGAT GACACAC AGGAT GCC C 2305 

2078 TCAAGGAGGTGGTGCAGCTGGAGAAGC AGCT GGGGGGAC AGCT GAT CCAGGAGCC AC GGG 2137 

I I M I I I I I II M I I I I I II I II II I II I II II I I I I II II 
2306 TGAAGGAAGTT CTACAACTGGAGAGGCAAATGGGAGGACAGCT CCTAGAAGAACCCAAGG 2365 

2138 T CCT GCACTT CAAGGACAGTT ACCACAACCT GCGC CT AT CCAT CCACGAT GT GCC C AGCT 2197 

III I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I 
2366 CT CT T C GTTTTAAAGGCAGCAT CCACAACCT GCGC CT GT CT ATT CAT GAC AT C GC C CATT 2425 

2198 C C CT GT GGAAGAGTAAGCT CCT T GTCAGCT AC C AGGAGAT CCCCTTT T AT C AC AT CT GGA 2257 

I I I I II I I I I I I I I I II I I M I I I I I I I I I I I I II I I II I I I I II 
2426 C C CT CT GGAAGAGCAAATT GCT GGCTAAGT AT C AGGAAATTCCATTT T AC C ACAT CT GGA 2485 

2258 ATGGCACGCAGCGGTACTT GC ACT GCACCTT CACC CT GGAGCGT GT C AGC CCCAGC ACT A 2317 

II I I I II I I I I I I II I I M II I M I I I I I I I I I M I I I I I I 

2486 GT GGCT CT CAAAGAAAC CT CCACT GCACCTT CACT CT GGAAAGACT CAGCCTAAAC ACAG 2545 

2318 GTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCA 2377 

II II II I I I I I II II III I I II I II II II II M I I II I I I II 
2546 TGGAACTGGTTTGCAAACTCTGTGTGCGGCAGGTTGAAGGAGAAGGGCAGATCTTCCAGC 2605 

2378 T CAACT TCAACAT CACCAAGGACACAAGGT T T GCT GAGCT GCT GGCT CTGGAGAGT GAAG 2437 

I I I I II I I I I I I I I I II II Mill II 

2606 TCAACTGTACTGTGTCAGAGGAACCTACTGGCATCGACTTACCTCTCCTGGACCCTGCTA 2665 

2438 CGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGA 24 97 

III I I I I II II I I I I II I I I I I III II I M II II 

2666 GT ACCATCAC CACT GT CACCGGACCAAGT GCT T T CAGC AT T C CT CT CC CT AT C CGGCAGA 2725 

2498 AGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCC 2557 

I I I I M II I II II III I III II I I M I M M I I I M 

2726 AGCT AT GCAGCAGC CT GGATGCCCCT CAAACAAGAGGC C ATGACT GGAGGAT GCT GGC C C 2785 

2558 AGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCA 2617 

I II I I I I I II I I I I II I I II I I II I I II I M I I I II II I I I I 
2786 ATAAACTCAACCTGGACAGGTACTTGAATTACTTTGCCACCAAATCGAGCCCAACTGGCG 2845 

2618 TGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTG 2677 

I II I I I I II I I II I II I I I I I I I M I II I M I I I II II I II I I 

2846 T AAT C CTGGAT CTTT GGGAAGCACAGAACTT C CC AGAT GGAAACCT GAGCAT GCT GGC AG 2905 

2678 CAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGT 2737 

II M I I I II I I I I I I I III I I I I I III 



Db 2906 CCGTCCT GGAAGAAAT GGGAAGACATGAGACAGTGGTGTACTT GGCAGCAGAAGGACAGT 2965 



Qy 2738 GCTGA 2742 

I I I 

Db 2966 ATTGA 2970 



RESULT 4 
CR598115 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



CR598115 1852 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DA006YG16 of Neuroblastoma of Homo 
sapiens (human) . 
CR598115 

CR598115. 1 GI: 50478922 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 



ORIGIN 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1852) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1852) 
Genoscope. 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .1852 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DA006YG16" 
/tissue_type="Neuroblastoma " 
/plasmid="pCMVSP0RT_6" 



Query Match 32.1%; Score 884; DB 3; Length 1852; 

Best Local Similarity 100.0%; Pred. No. 7.5e-176; 

Matches 884; Conservative 0; Mismatches 0; Indels 0; 



Gaps 



0; 



Qy 1869 GGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCAC 1928 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCAC 60 

Qy 1929 CGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCG 1988 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 


61 


CGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCG 


120 


Qy 


1 y O y 


rrvrAA(zrTarTTCT(ZTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGT 


2048 




I I I I I I I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


CCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGT 


180 


A,, 

Qy 


z ufi y 




2108 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


181 


CTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCT 


240 


Qy 


01 no 


LroVjLoljALAoL X bAl LLALoAvjLL.t\LL\jL X L\-* X X X \^r\J-\\j \jj-\\^J-\\j X X ^J^i\^r\r\^ x 


2168 




1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


. 241 


GGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCT 


300 


Qy 


zioy 


rrrrr^7\T i r , r , a r rr i r , arrB r prTrrrrnrr r pr , prTr r prraA^ACTAAr;rTrrTTnTr , ArirTA 

oLLLL X Al LLA1 LLALLA1 ol <crLLL/\LL X ^L^L, X KjK^t\t\\jJ\\j 1 MJ-\\j\^ X \^\^ X X \j1 ^rtoOXA 


2228 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


GCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTTGTCAGCTA 


360 


Qy 


ZZZy 


r , rarraraa i rrrPTTTTBTrBraTPTrraaTrcr , ArcrAr;rnCTAr , TTCrArTnrArrTT 
LLAIjIjAIjAI LULL 111 x AX LALA1 L 1 boMl LjLjV^/\L*^L*.Hajt^oLj X X o^.rt\_* X u^ft^^ X X 


7288 

£. £+ \> \> 




1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 




Db 


361 


CCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTACTTGCACTGCACCTT 


420 


Qy 


z^o y 


rBr , rr^rrarrr^rT i r , ArrrrrarrAr , TACTCArrT^nrrTr;rAAnr , TnTnrifIT^TnRrA 


2348 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 H 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


CACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCA 


480 


Qy 




GGxl (jLAGlCjLVjALCjLIjLALAlL i 1 LALjLAI LAAL 1 1 LAALA1 L/\L L-/\/\^J ljj/\^/\^>\MXa Kj X X 


?4 Oft 

C. *± \J o 




1 II 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


481 


GGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAAGGACACAAGGTT 


540 


Qy 


z4uy 


1 1 CjACjL 1 VjL 1 (j(jL 1 L 1 LLAljrAtj 1 LAALLLtIjLLo 1 LLLALLLL 1 IjVj 1 LLLLLLL/\L X 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


TGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGC 


600 


Qy 


Z4by 


Li 1 LAALA1 LLLL 1 1 LL 1 LAI 1 ^bbL/ibMurtJ, nnl X X LL/\LLL X 0v3.tt.UL> W-\\-.v*.^ X kj 


2528 




1 ll 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 




Db 


601 


CTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAG 


660 


Qy 


z dz y 


rrrrrrTr , r , r , r , ar ,r pr , rrrrarTr* r Prrr , rrACAAAr , TrrArrTfX(^Ar , AnrrATrTrAnrTT 


2588 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 II 1 1 II 1 I.I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


661 


GCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTT 


720 


Qy 


zoo y 


bill uLL 1 bbnAbbbbnbLLLLnLAIjLLAl L.tt.X LL X Ltttt\>U. X 0 X 0 \j <jJ-\\j X x 


2648 






1 | I I I | I I I | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


CTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCGCGGCACTT 


780 


Qy 


Z Dfi -7 


rrrr AAraarAArrTCAnCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGC 


2708 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 
M 1 II II 1 1 1 1 1 1 1 1 1 1 M 1 M 1 II ! 1 I 1 II 1 1 1 1 1 II 1 1 1 M 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 




Db 


781 


CCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGC 


840 


Qy 


2709 


TGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


T GGCCT CTTCACAGT GTCGGAGGCT GAGT GCTGAGGCCGGCCAG 884 
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AK018177 3866 bp mRNA linear HTC 03-APR-2004 

Mus musculus adult male medulla oblongata cDNA, RIKEN full-length 
enriched library, clone : 63304 15E02 product : TRANSMEMBRANE RECEPTOR 
UNC5H2 homolog [Rattus norvegicus] , full insert sequence. 
AK018177 

AK018177 .1 GI : 12857775 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; . Muridae; Murinae; Mus. 
1 

Carninci, P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N. 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H. 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. , Nishine,T., 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E. 



Carninci, P. , 

Itoh,M. , 
Harada,A. , 
Kashiwagi, K. , 
. Watahiki,M., 



Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 

Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

Genome Res. 10 (11), 1757-1771 (2000) 

20530913 

11076861 

4 

The RiKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3866) 

Adachi,J., Aizawa,K., Akahira,S., Akimura,T., Arai,A., Aono,H., 
Arakawa,T., Bono,H., Carninci, P., Fukuda,S., Fukunishi, Y. , 
Furuno,M., Hanagaki,T., Hara,A. , Hayatsu,N., Hiramoto,K., 
Hiraoka,T. , Hori, F., Imotani,K. , Ishii, Y. , Itoh,M., Izawa,M., 
Kasukawa,T., Kato,H., Kawai,J., Kojima,Y., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A. , Nishi,K., 
Nomura, K., Numazaki,R., Ohno,M., Okazaki,Y., Okido,T., Owa,C, 



Saito,H., Saito,R., Sakai,C, Sakai,K., Sano,H., Sasaki, D. , 
Shibata,K., Shibata,Y., Shinagawa, A. , Shiraki,T., Sogabe,Y., 
Suzuki, H., Tagami,M., Tagawa,A., Takahashi , F. , Tanaka,T., 
Tejima,Y., Toya,T., Yamamura, T . , Yasunishi , A. , Yoshida,K., 
Yoshino,M., Muramatsu,M. and Hayashizaki, Y . 
TITLE Direct Submission 

JOURNAL Submitted ( 10- JUL-2000) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . jp, 
URL :http: //genome. gsc. riken. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

COMMENT Please visit our web site (http://genome.gsc.riken.jp/) for further 

details . 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. First strand cDNA was primed with a primer 
[5' GAGAGAGAGAAGGATCCAAGAGCTCTTTTTTTTTTTTTTTTVN 3'], cDNA was 
prepared by using trehalose thermo-activated reverse transcriptase 
and subsequently enriched for full-length by cap-trapper. cDNA went 
through one round of normalization to Rot = 10.0 and subtraction to 
Rot = 100.0. Second strand cDNA was prepared with the primer 
adapter of sequence [5 f 

GAGAGAGAGATTCT CGAGTTAATTAAATTAAT CCCCCC CCCC CC C 3']. cDNA was cleaved 
with BamHI and Xhol . Vector: a modified pBluescript KS(-f-) after 
bulk excision from Lambda FLC I. Cloning sites, 5' end: Sail; 3' 
end: BamHI. Host: DH10B. 
FEATURES Location/Qualifiers 
source 1. .3866 

/organism="Mus mus cuius" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref ="FANTOM_DB : 6330415E02" 

/db_xref="taxon: 10090" 

/clone="6330415E02" 

/ sex="male" 

/ tissue_type="medulla oblongata" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="adult" 
CDS 417. .3254 

/note="unnamed protein product; TRANSMEMBRANE RECEPTOR 

UNC5H2 homolog [Rattus norvegicus] (SPTRI 008722, evidence: 

FASTY, 96.5%ID, 100%length, match=2835) 

putative " 

/codon_start=l 

/protein_id="BAB31108 .1" 

/db_xref="GI : 12857776" 

/translation="MRARSGWSALLLALLLCWDPTPSLAGVDSAGQVLPDSYPSAPA 
EQLPYFLLEPQDAYIVKNKPVELHCRAFPATQIYFKCNGEWVSQNDHVTQESLDEATG 
LRVREVQIEVSRQQVEELFGLEDYWCQCVAWSSSGTTKSRRAYIRIAYLRKNFDQEPL 
AKEVPLDHEVLLQCRPPEGVPVAEVEWLKNEDVIDPAQDTNFLLTIDHNLIIRQARLS 
DTANYTCVAKNIVAKRRSTAATVIVYWGGWSSWAEWSPCSNRCGRGWQKRTRTCTNP 
AP LN GGAFC E GQAFQKT ACTT VC PVDGAWT EW S KW SAC S T ECAHW RS RE CMAP P PQN G 
GRDCSGTLLDSKNCTDGLCVLNQRTLNDPKSHPLETSGDVALYAGLWAVFVVVAVXM 



AEGVIVYRRNCRDFDTDITDSSAALTGGFHPVNFKTARPNNPQLLHPSAPPDLTASAG 
IYRGPVYALQDSADKIPMTNSPLLDPLPSLKIKVYNSSTIGSGSGLADGADLLGVLPP 
GTYPGDFSRDTHFLHLRSASLGSQHLLGLPRDPSSSVSGTFGCLGGRLSLPGTGVSLL 
VPNGAI PQGKFYDLYLHINKAESTLPLSEGSQTVLS PSVTCGPTGLLLCRPVVLTVPH 
CAEVIAGDWIFQLKTQAHQGHWEEWTLDEETLNTPCYCQLE7VKSCHILLDQLGSYVF 
MGES YS RS AVKRLQLAI FAPALCT SLE YS LRVYCLEDT PVALKEVLELERTLGGYLVE 
EPKPLLFKDSYHNLRLSLHDIPHAHWRSKLLAKYQEIPFYHVWNGSQRALHCTFTLER 
HSLASTEFTCKVCVRQVEGEGQIFQLHTTLAETPAGSLDALCSAPGNAITTQLGPYAF 
KIPLSIRQKICSSLDAPDSRGNDWRLLAQKLSMDRYLNYFATKASPTGVILDLWEARQ 
QDDGDLNSLASALEEMGKSEMLVAMATDGDC" 

ORIGIN 

Query Match 31.7%; Score 872.4; DB 3; Length 3866; 

Best Local Similarity 60.6%; Pred. No. 2.3e-173; 

Matches 1646; Conservative 0; Mismatches 941; Indels 129; Gaps 8; 

Qy 157 GC CAACCC GGACCT GCT T CC C C ACT TC GT GGT GGAGC C C GAGGAT GT GT AC AT CGT CAAG 216 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 540 GCCCCTGCGGAGCAGCT GCCGTACTTCCTATT GGAGCCACAGGACGCCTACAT CGTAAAG 599 

Qy 217 AACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGC 276 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 600 AACAAGC CAGT GGAACT GCACT GCAGAGCCT T CCCT GC CACGCAGAT CT ACTT CAAGT GT 659 

Qy 277 AACGGGGAGTGGGT GCGCCAGGT GGACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT 336 

I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I II 

Db 660 AAT GGC GAGT GGGT CAGC CAGAAT GACCACGT CACACAGGAGAGCCT GGAT GAGGCCAC A 719 

Qy 337 GGGCT GCCCACCAT GGAGGT CCGCATTAAT GT CT CAAGGCAGC AGGT C GAGAAGGT GTT C 396 

II III I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 

Db 720 GGCTT GC GGGTGC GAGAGGT GCAGATCGAGGT GT CAC GGCAGCAAGT GGAGGAACT CTT C 779 

Qy 397 GGGCT GGAGGAAT ACT GGT GC CAGT GC GT GGCAT GGAGCT C CTC GGGCACCAC CAAGAGT 456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
Db 780 GGGCTCGAGGACTACTGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGT 839 

Qy 457 CAGAAGGC CT ACAT CC GCAT AGCCAGATT GC GCAAGAACTT C GAGC AGGAGCC GCT GGC C 516 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 840 CGCCGAGCCTACATCCGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCC 899 

Qy 517 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 900 AAGGAGGTACC CTT GGAT CAT GAGGTC CT T CT GCAGT GC CGCCCAC CGGAGGGAGT GCCT 959 

Qy 577 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 960 GT GGCT GAG GT GGAAT GGCT CAAGAAT GAAGATGT CAT T GACC C C GCT C AGGACACT AAC 1019 

Qy 637 GT AT ACAT CAC GC GGGAGCACAGCCTGGT GGT GC GACAGGC C C GC CTT GCT GACAC GGC C 696 

I II I I I I I I I I I I I I I I I I I I I I I I I I I 1111111111 

Db 1020 TT C CTGCTC AC CATT GAC C ACAAC CT CAT CAT CC GC CAGGC GC GCCT CT CAGACACGGC C 1079 

Qy 697 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 756 

I I I I I I I I 111 I I I I I I I I I I I I I I I I III I I I I I I I I III II I I I I 

Db 1080 AACT AC ACCT GT GT GGC CAAGAAT ATC GTGGC CAAGC GC CGGAGCACC GCGGC CACAGT C 1139 



Qy 



757 ATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGC 816 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 



I 1 1 1 I I 1 1 I 1 1 1 I I I I I I I I I I I 1 1 I I 1 1 1 1 I I I I III I II 

1140 ATCGTCTATGTGAATGGAGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGTTCCAATCGC 1199 



817 



876 



TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 

I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I II II I I I I I I I II 
1200 TGTGGCCGAGGCTGGCAGAAGCGTACTCGGACCTGCACCAATCCAGCCCCACTCAATGGA 1259 



877 



936 



GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 

I II I I I I I I I I I I I I I Ml I I I II I I I I I II III I I I I I I I I I I I I I I I 

1260 GGCGCCTTCTGTGAGGGACAGGCCTTCCAGAAGACAGCTTGCACCACCGTGTGCCCAGTG 1319 



937 



996 



GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1320 GAT GGAGC GT GGAC C GAGT GGAGCAAGT GGT CT GC CT GC AGCACAGAGT GT GCGCACT GG 1379 

997 CGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACT 1056 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I MM 

1380 CGCAGCCGCGAGTGCATGGCACCGCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACG 1439 

1057 GACCTGGACACCCGCAACTGT ACCAGT GACCT CT GT GT AC ACAGT GCT T CT GGC C 1111 

I I I II I I I I I I I I I II M I I II I II I 
1440 CTACTTGACTCCAAGAACTGCACTGATGGGCTGT GCGT GCTGAATCAGAGAACT CTAAAC 1499 

1112 CTGAGGACGTGGCCCTCTATGTGGGCCTCATC 1143 

II I I M M I II I I I Mill I 
1500 GACCCTAAAAGCCACCCCCTGGAGACATC GGGAGAT GT GGCACT GTACGCAGGC CTT GT G 1559 

1144 GCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTC CTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I II I I I I M I I I I I I 

1560 GTGGCCGTCTTTGTGGTGGTAGCGGTTCTCATGGCCGAGGGAGTGATCGTATACCGGAGA 1619 

1201 AAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGT CCATTCTCACCTCAGGCTTC 1257 

M M I I I I I I I I I I II II I I Mill MMM 

1620 AACTGCCGGGACTTCGACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTC 1679 

1258 CAGCCCGT CAGCATCAAGCCC AGCAAAGCAGACAACCC CC AT CT GCT CACCATC 1311 

II I I II I I I I I I I I I I I M II I I I I I M M II I 

1680 CACCCTGT CAACT T CAAGACT GCAAGGCC CAACAACCC GCAGCT C CT GCAC CCGT C C GCC 1739 

1312 CAGC CGGACCT CAGCACCACCACCACCACCT AC C AGGGC AGTCT CT GT CCC C GGCAGGA- 1370 

I I I II I II I III I I I I II M M I I I I I II I II II I 
1740 CCTCCAGACCTAACGGCCAGTGCTGGCATCTACCGCGGGCCTGTGTATGCCCTGCAGGAC 1799 

1371 TGGGCCCAGCCCCAAG 1386 

I I I I II I I I I I I 

1800 T C C GCCGACAAGAT C CCC ATGACTAAT TCGCCC CT GCT GGATC C C CT GCC CAGC CT CAAG 1859 

1387 TT C CAGCT CAC CAAT GGGCAC CT GCT C AG C 1416 

I I II I I I I I M I I 

1860 ATCAAGGTCTATAACTCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGAC 1919 

1417 CCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAG 1476 

I I M II M I M I I II I II I III M II I 

1920 CTGCTGGGTGTCCTCCCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTC 197 9 



1477 TTCGTCTCCCGCCTCTCCACCC- 
I I III Mill 



- AGAACT ACT TCCGCTCCCT GC C CC GAGGCAC C 1530 

I Mill II I II II I I M 



Db 1980 CTGCACCTGCGCAGTGCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCC 2039 

Qy 1531 AGCAAC AT GACCT AT GGGAC CTT CAACTT CCT C GGGGGCC GGCT GAT GAT C C CTAAT ACA 1590 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2040 AGCAGCAGTGTCAGCGGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCTCCCCGGCACA 2099 

Qy 1591 GGT AT C AGC CT CCT CAT C C C CC CAGAT GCCATACCCC GAGGGAAGAT CT AT GAGAT CTAC 1650 

II I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I IN 

Db 2100 GGGGTCAGCCTGTTGGTACCAAATGGAGCCATTCCCCAGGGCAAGTTCTAT GACCT GTAT 2159 

Qy 1651 CTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTG 1710 

II ! Mill I III I I I I I I I I I I I I I I I 

Db 2160 CTACATAT CAACAAGGCCGAAAGCACCCTCCCACTTT CAGAAGGTTCCCAGACAGTATTG 2219 

Qy 1711 AGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCT 1770 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2220 AGCCCCTCGGTGACCTGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACC 2279 

Qy 1771 ATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCG 1830 

II I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2280 GTGCCCCACTGTGCTGAAGTCATCGCTGGAGACTGGATCTTTCAGCTCAAGACCCAGGCC 2339 

Qy 1831 TGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTAC 1890 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2340 CATCAGGGCCACT GGGAGGAGGT GGT GACCTTGGAT GAGGAGACCCTCAACACACCCTGC 2399 

Qy 1891 TACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCC 1950 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 

Db 2400 TACTGCCAGCTGGAGGCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTTCCTACGTA 2459 

Qy 1951 CTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCG 2010 

I I I I I I I I I I I I I I I I II I I I I I II I I I I I Mill. 

Db 2460 TTCATGGGCGAGTCCTACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCC 2519 

Qy 2011 C C GGTGGCCT GCAC CTCC CT CGAGT ACAAC ATCC GGGT CT ACTGC CT GC AT GAC AC C CAC 2070 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III I I I I I I I 

Db 2520 CCAGCCCTCTGCACCTCCCTGGAGTATAGCCTCAGGGTCTACTGTCTGGAGGACACACCT 2579 

Qy 2071 GATGCACTCAAGGAGGT GGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCTGATCCAGGAG 2130 

I I I I I I I I I I II I I I I I I III I II I I I Mil II I II I Mill 

Db 2580 GT AGCACT GAAGGAGGT CCT GGAGCT GGAGAGGACT CT GGGT GGCT ACT T GGT GGAGGAG 2639 

Qy 2131 CCAC GGGT CCT GCACTT CAAGGACAGT T AC CACAAC CT GC GC CT AT CCAT C CAC GAT GTG 2190 

II I I I I I II I I II I I I II I I I II II I II I II I II II I I Tl I M I 

Db 2640 C C CAAGC CTTT GCT CTT TAAGGAC AGTT ACC ACAACCT ACGCCT CT C CCT CCAT GACAT C 2699 

Qy 2191 CC CAGCT C CCT GT GGAAGAGTAAGCT C CT T GT C AGCTAC CAGGAGAT CC C CTTT TAT CAC 2250 

III III I II I II I I I M II I II I II I I I I II I I II I II II I M 

Db 2700 CC C CAT GC C CACT GGAGGAGCAAAC TACT GGCCAAGT ACC AGGAGATTCCCTT CTAC CAC 2759 

Qy 2251 AT CT GGAAT GGCAC GCAGC GGT ACTT GCACT GCACCTT C ACCCT GGAGCGT GTC AGC CCC 2310 

M II II II II II II I I I M M I II II I M II II II I II I I MM 
Db 2760 GT CT GGAAT GGC AGC CAGAGAGC CCT GCACT GCACT TT CAC CCT GGAGAGGC AT AGCCT G 2819 

Qy 2311 AGCACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGC 2370 

III II I I I II I I I I I I M I II I I II I II II M I I I II I 
Db 2820 GCCTCCACGGAGTTCACCTGTAAGGTCTGCGTGCGGCAGGTCGAAGGGGAAGGCCAGATT 2879 



Qy 2371 T T CAGC AT CAACTT CAACAT CACC AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTG 2427 

III III I III II III II II 

Db 2880 TTCCAGCTGCACACAACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCT 2939 

Qy 2428 GAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTC 2487 

I I I III I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2940 GCCCCGGGCAATGCCATCACCACCCAGCTGGGACCCTATGCCTTCAAGATACCCCTGTCC 2999 

Qy 2488 ATTCGGCAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGG 2547 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3000 ATC C GCCAAAAGATCT GCAGCAGC CT GGACGCCC CCGACT CCCGGGGCAAC GACT GGAGG 3059 

Qy 2548 ACTCTGGCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGC 2607 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 3060 CTGTTGGCGCAGAAGCTGTCCATGGACCGGTACCTAAACTACTTCGCCACCAAAGCTAGT 3119 

Qy 2608 CCCACAGCC ATGATC CT CAAC CT GT GGGAGGC GCGGCACTT C CC CAAC GGCAAC CT CAGC 2667 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3120 CCC ACAGGT GT CATCTT AGAC CT CT GGGAAGCT C GGCAACAGGAT GACGGGGACCT CAAC 3179 

Qy 2668 CAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCG 2727 

I I I I I II I II I I I I I I I I II I III I 

Db 3180 AGC CTGGCCAGT GCCTTGGAGGAGAT GGGCAAGAGT GAGAT GCT GGT AGC C AT GGC CACA 3239 

Qy 2728 GAGGCT GAGT GCT GAG 2743 

III I I I I I I I I I 
Db 3240 GAT GGCGATT GCT GAG 3255 



RESULT 6 
AY406492 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Pan. 



TITLE 



AY406492 2802 bp DNA linear GSS 15-DEC-2003 

Pan troglodytes UNC5C gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY406492 

AY406492.1 GI : 39762466 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2802) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human -chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2802) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A. , Tanenbaum, D.M. , Civello, D.R. , Lu,F., Murphy,B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 



JOURNAL Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2802 

/organism= f, Pan troglodytes" 
/ mo l_type=" genomic DNA" 
/db_xref="taxon: 9598" 
gene <1. .>2802 

/gene="UNC5C" 
/locus_tag="HCM2575" 

ORIGIN 

Query Match 29.6%; Score 814; DB 9; Length 2802; 

Best Local Similarity 53.8%; Pred. No. 4.7e-161; 

Matches 1477; Conservative 0; Mismatches 1200; Indels 69; Gaps 6; 

Qy 57 GCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGG 116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 66 GCTCGTGCTACCTGCCCTGGCCCTGCTCAGCGCCAGCGGCACTGGCTCCGCCGCCCAAGA 125 

Qy 117 TGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCC 176 

II I I I I I I I I I I I I I I I I I I I I 

Db 126 T GAT GACTTTTTT CAT GAACT CC C AGAAACTTT T C CTT C GGAT CCACCT GAGCCT CT GC C 185 

Qy 177 CCACTT C CTGGTGGAGCCCGAGGAT GT GTACAT CGT CAAGAACAAGC C AGT GCT GCTT GT 236 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 186 ACATTT C CTT ATT GAACCT GAGGAAGCTT AT ATT GT GAAGAATAAGCCT GT GAAC CT GT A 245 

Qy 237 GTGCAAGGCC- GT GCC C GCCACGCAGAT CTT CT TCAAGT GCAAC GGGGAGT GGGT 290 

I I I I I I I 

Db 246 CTGTAAAGCAAGCCCTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 305 

Qy 291 GCGCC AGGTGGAC C ACGT GAT C GAGCGCAGCACAGAC GGGAGCAGT GGGCT GCC C AC CAT 350 

Db 306 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 365 

Qy 351 GGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATA 410 

Db 366 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 425 

Qy 411 CT GGT GC CAGT GC GT GGCATGGAGCT CCT CGGGCACC ACCAAGAGT CAGAAGGCCT AC AT 470 

Db 426 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 485 

Qy 471 CCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCT 530 

I I II I I II I I II I I I I I I I I I I I I I I I I I I I I 
Db 486 NNNNNNNNNNNNNNNNCGGAAGACATTTGAGCAGGAACCCCTAGGAAAGGAAGTGTCTTT 545 

Qy 531 GGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGA 590 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 546 GGAACAGGAAGT CT T ACT CCAGT GT CGGCCAC CT GAAGGGAT C CCAGT GGCT GAGNNNNN 605 

Qy 591 GT GGCTC C GGAACGAGGAC CT GGT GGACC C GT C C CT GGAC C CCAAT GT AT AC AT CAC GC G 650 

I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 606 NNNNNNGAAAAAT GAAGACATAATT GATC CCGTT GAAGAT CGGAATTTTT AT AT TACT AT 665 



Qy 651 GGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 710 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 666 T GAT CACAAC CT CAT CATAAAGC AGGC CCGACT CT CT GAT ACT G CAAATT ATAC CT GT GT 725 

Qy 711 GGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAA 770 

I I I I I I I I I I I I I I I II I III I I I I I I I I I I II I I I I 

Db 726 T GCCAAAAAC AT T GTTGC CAAGAGGAAAAGT ACAACT GCCACT GT CAT AGT CT AT GT CAA 785 

Qy 771 CGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTG 830 

I I I I II I I I I I II I I I I I I I I I I I I I II II I I I I I I I I I I II II I 
Db 78.6 CGGTGGCTGGTCCACCTGGACGGAGTGGTCTGTGTGTAACAGCCGCTGTGGACGAGGGTA 845 

Qy 831 GCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGA 890 

I I I I I I I I I III II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
Db 846 T CAGAAACGT ACAAGGACTT GT AC CAACCC GGC ACC ACTCAAT GGGGGT GC CT T CT GT GA 905 

Qy 891 GGGGC AGAAT GT CCAGAAAACAGC CTGCGC CAC C CT GT GCC C AGT AGACGGCAGCT GGAG 950 

I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I II I I I I I I 
Db 906 AGGGCAGAGT GT GCAGAAAAT AGC CT GT ACT AC GTT AT GC C CAGT GGAT GGCAG GT GGAC 965 

Qy 951 CCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTG 1010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 966 GCCATGGAGCAAGTGGTCTACTTGTGGAACTGAGTGCACCCACTGGCGCAGGAGGGAGTG 1025 

Qy 1011 CT CTGACCCAGCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACT GACCTGGACACCCG 107 0 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1026 CACGGCGC CAGCC C CCAAGAATGGAGGCAAGGACT GCGAT GGC CT C GT CT T GCAAT C CAA 1085 

Qy 1071 CAACT GT AC CAGT GACCT CT GT GT ACACAGT GCTT CT GGC CCT GAGGACGT GGC CCT CT A 1130 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1086 GAACT GC ACT GAT GGGCT TT GCAT GCAGACT GCT C CT GAT T CAGAT GATGTTGCT CT CT A 1145 

Qy 1131 TGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCT 1187 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1146 TGTTGGGATTGTGATAGCAGTGATCGTTTGCCTGGCGATCTCTGTAGTTGTGGCCTTGTT 1205 

Qy 1188 C GT TT ATT GC C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT CCATT CT CAC 1247 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1206 T GT GT AT CGGAAGAAT C ATCGT GACTTT GAGT CAGAT ATT AT T GACT CTT C GGC ACT CAA 1265 

Qy 1248 CT C AGGCTT C CAGC C CGT CAGCAT CAAGCC CAGCAAAGCAGACAACCCCC ATCT GCT CAC 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1266 TGGGGGCTTTCAGCCTGTGAACATCAAG GCAGCAAGACAAGAT CT GCT GGC 1316 

Qy 1308 CATCCAGC CGGAC CT CAGCAC CAC CACCACC AC CT AC CAGGGC AGT CT CT GTCC C C GGCA 1367 

II I I I I I I I I I I I I III III II I I I I I I I I I I I 
Db 1317 T GTACCC CC AGAC CT CAC GT CAG CT GCAGCC AT GT AC AGAGGAC CT GT CT AT GC C CT GCA 1376 

Qy 1368 GGATG GGCCCAGCCCCAAGTTCCAGCTCACCAAT GGGCACCTGCTCAGCCC 1418 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1377 T GAC GTCT CAGACAAAAT CCCAAT GAC CAACT CT CCAATT CT GGAT C CACT GC C CAAC CT 1436 

Qy 1419 CCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTT 1478 

I Mill I I I II III I I I I I I 

Db 1437 GAAAAT CAAAGT GT ACAAC AC CT C AG GT GCT GT CAC C C C C CAAGAT G AC CT CT CT GAGT T 1496 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1479 CGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACAT 
III I I I I I I I I I I I I II I I I I I I I 

1497 T AC GT CCAAGCT GT C CCCTCAGAT GACC CAGT C ATTGT TGGAGAAT GAAGC CCT C AGC CT 



1538 



1556 



1556 



1539 GA CCTATGGGACCTTCAA 

II I I I I I I I I II 

1557 GAAGAAC C AGAGT CT AGCAAGGC AGACT GAT C CAT CCT GT ACCGC ATTT GGCAGCTT CNN 1616 

1557 CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1617 NTNGCTGGGNNNNCACCTTATTGTTCCCAATTCAGGAGTCAGCTTGCTGATTCCCGCTGG 1676 

1617 T GCCATAC CCCGAGGGAAGAT CT AT GAGAT CT AC CT C AC GCT GCACAAGCC GGAAGAC GT 1676 

I I I I I I I I I I II I I I I I I I I I I I I III I I I I I I III I 
1677 GGCCATT CCCCAAGGGAGAGTCTACGAAAT GTATGTGACTGTACACAGGAAAGAAACTAT 1736 

1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 1736 

I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I II I I I I I I I 
1737 GAGGCCACCCATGGATGACTCTCAGACACTTTTGACCCCTGTGGTGAGCTGTGGGCCCCC 1796 

1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

III I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
1797 AGGAGCTCTGCTCACCCGCCCCGTCGTCCTTACTATGCATCACTGCGCAGACCCCAATAC 1856 

1797 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 1856 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1857 CGAGGACT GGAAAATACT GCTCAAGAACCAGGCAGCACAGGGAC AGT GGGAGGAT GT GGT 



1916 



1857 



GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 

1917 GGTGGTCGGGGAGGAAAACTTCACCACCCCCTGCTACATTCAGCTGGATGCAGAGGCCTG 1976 

1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1976 

I I I I I I I I I I I I I I I II II I I I I I I I I I II I II III II 
1977 CCACATCCTCACAGAGAACCT C AGCAC CTACGCCCT GGT AGGAC ATT C CAC CAC CAAAGC 



2036 



1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

2037 GGCTGCGAAGCGCCTCAAGCTGGCCATCTTTGGGCCCCTGTGCTGCTCCTCGCTGGAGTA 2096 

2037 CAAC ATCC GGGT CT ACT GCCT GCAT GACAC C CAC GAT GCACTCAAGGAGGT GGT GCAGCT 2096 

II I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I II I I I I I I I II II 
2097 CAGCATCC GAGT CT ACT GTCT GGAT GACAC C CAGGAT GCCCTGAAGGAAATTTT AC ATCT 2156 

2097 GGAGAAGC AGCT GGGGGGACAGCT GAT CCAGGAGC CACGGGTC CT GCACTT CAAGGACAG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
2157 TGAGAGACAGAT GGGAGGACAGCT C CT AGAAGAAC CT AAGGCT CTT CAT TT TAAAGGCAG 2216 

2157 T T AC CACAACCT GC GC CT AT C CAT C CAC GAT GT GC CC AGCT CC CTGT GGAAGAGTAAGCT 2216 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 
CACCCACAAC CT GC GCCTGT CAATT CACGAT AT CGCC CATT CC CT CT GGAAGAGCAAATT 2276 



2217 



2217 



CCTT GT CAGCTAC CAGGAGAT C C CCTTT T AT CACAT CT GGAAT GGC AC GC AGC GGT ACT T 

I I I I I ! Ill III 
2277 GCTGGCTAAATATCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAACCT 



2276 



2336 



2277 GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 2336 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2337 GC ACTGCACCTT CACT CT G GAAAGATTT AGCCT GAACACAGT GGAGCT GGT T T G CAAACT 2396 



Qy 2337 GTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAA 2396 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2397 CTGT GT GCGGCAG GT GGAAGGAGAAGGGC AGAT CTT CCAGCT CAACT GCAC C GT GT CAGA 2456 

Qy 2397 GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 2456 

I I I I I I I I I I I I I I I I II I I I I I 

Db 2457 GGAACCT ACT GGCAT CGAT TTGCCGCT GCT GGATC CTGC GAACACCAT C AC CAC GGT CAC 2516 

Qy 2457 GGGCCCC AGT GCCTT CAAGAT C CC CT T C CT CAT TC GGCAGAAGATAATTT C CAGC CT GGA 2516 

I I I I I I I I I I I I I I I Mill III I I I I I I I I I I I I I I I I I I I I I I 
Db 2517 GGGGCCCAGTGCTTTCAGCATCCCTCTCCCTATCCGGCAGAAGCTCTGTAGCAGCCTGGA 2576 

Qy 2517 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 2576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2577 T GCC CCC CAGACGAGAGGCCAT GACT GGAGGAT GCT GGC CCATAAGCNNNNNNNNNNNNN 2636 

Qy 2577 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2636 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2637 GTACTT GAATTACTTT GCCACCAAAT C CAGC CCAACT GGCGTAAT CCT GGAT CTT T GGGA 2696 

Qy 2637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 

Db 2697 AGCACAGAACTT C CCAGAT GGAAAC CT GAGCAT GCT GGC AGCT GT CTT GGAAGAAAT GGG 2756 

Qy 2697 C CAGCC AGAC GCT GGCCT CTT CACAGT GT CGGAGGCTGAGT GCT GA 2742 

I II II III II I I I I III II 
Db 2757 AAGACAT GAAACGGT GGT GT CCT T AGCAGC AGAAGGGCAGT ATTAA 2802 
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AY411747 2532 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411747 

AY411747.1 GI: 39767715 
GSS . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

-2 (bases 1 to 2532) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams , M . D . and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2532 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
gene <1. .>2532 

/locus_tag="HCM4327" 

ORIGIN 

Query Match 29.4%; Score 810.4; DB 9; Length 2532; 

Best Local Similarity 61.1%; Pred. No. 2.7e-160; 

Matches 1540; Conservative 0; Mismatches 851; Indels 129; Gaps 9; 

Qy 352 GAGGTCC GCATTAATGT CTCAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAAT AC 411 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13 GAGGTGCAGAT C GAGGT GT C GC GGCAGC AGGT GGAGGAGCT CTT T GGGCT GGAGGATT AC 72 

Qy 412 TGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATC 471 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 73 TGGTGCCAGTGCGTGGCCTGGAGCTCCGCGGGCACCACCAAGAGTCGCCGAGCCTACGTC 132 

Qy 472 CGCAT AGC CAGATT GCGCAAGAACTTC GAGCAGGAGC CGCT GGC CAAGGAGGT GT C CCT G 531 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I 

Db 133 CGCATCGCCTACCTGCGCAAGAACTTCGATCAGGAGCCTCTGGGCAAGGAGGTGCCCCTG 192 

Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 193 GACCATGAGGTTCTCCTGCAGTGCCGCCCGCCGGAGGGGGTGCCTGTGGCCGAGGTGGAA 252 

Qy 592 TGGCTC C GGAACGAGGACCT GGT GGAC CCGT C CCT GGAC CCCAAT GTAT ACAT CACGC GG 651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 253 TGGCTCAAGAAT GAGGAT GT CAT CGAC CCCAC C CAGGACACCAACTT C CT GCT CACCAT C 312 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 313 GAC CACAAC CT CAT CAT CCGC C AGGC C CGCCT GT C GGAC ACT GC CAACT AT ACCT GCGT G 372 

Qy 712 GC CAAGAACAT CGT GGCAC GT CGC C GC AGCGC CT C CGCT GCT GT CAT C GT CT AC GT GAAC 771 

I II I I II I I I I I I I I I I I I I I I II I II I II I I I II I I I I I I I I I I II I 

Db 373 GC CAAGAACAT CGT GGCCAAACGCC GGAGCAC CACT GCCACC GT CAT C GT CT AC GT GAAT 432 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II 
Db 433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGCTCCAACCGCTGTGGCCGAGGCTGG 4 92 

Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I III 
Db 493 CAGAAGCGCACCCGGACCTGCACCAACCCCGCTCCACTCAACGGAGGGGCCTTCTGCGAG 552 



Qy 



892 



GGGCAGAATGT CCAGAAAACAGCCT GCGCCACCCT GT GCCCAGT AGACGGCAGCT GGAGC 
II III I I I I I I I II I I I I I I I I I I I I I I I I I I I I II II I I I I 



951 



Db 553 GGCCAGGCATT CCAGAAGAC CGCCT GCAC CACC ATCT GC C CAGT C GAT GGGGCGT G GAC G 612 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 613 GAGTGGAGCAAGT GGT CAGC CT GC AGCACT GAGT GT GCC C ACT GGCGT AGCCGC GAGT GC 672 

Qy 1012 TCT GACCCAGCAC CC C GCAACGGAGGGGAGGAGT GC CAGGGC ACT GAC CT GGACAC C CGC 1071 

I II I I I I I I I I I I I I I I II III I I I I II Ml I 

Db 673 ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 

Qy 1072 AACTGT AC CAGT GACCT CT GT GT ACAC AGT GCTT CT 1107 

I I I I I I I I I I I I I I II I I 
Db 733 AACTGCACAGAT GGGCT GT GCAT GCAAAATAAGAAAACT CTAAGC GAC CC CAACAGC CAC 792 

Qy 1108 GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 1155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 793 CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCATCTTCGTG 852 

Qy 1156 TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1215 

I I I I I I I I I II I I I I I I I I I I I I I I 

Db 853 GTCGTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 912 

Qy 1216 GACTCAGATGTGGCTGACTCGTCCATT CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1272 

I I I I I I I I I I I I I I I II I MM II I I I I I I I I I I II I I 

Db 913 GACACAGACAT CACT GACT CAT CT GCTGCC CT GACT GGT GGT TTCCAC C C C GT CAACT TT 972 

Qy 1273 AAGCCCAGCAAAGCAGACAACCCCCATCTGCT CACCATCCAGCCGGACCTCAGC 1326 

I I I I I I I I I I I I I I I I I I II II I I I I II I I 

Db 973 AAGACGGCAAGGCCCAGCAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACA 1032 

Qy 1327 AC CAC CAC CAC CAC CT AC CAGGGC AGTCTCT GT C CCC GGCAGGAT GGG 1374 

I I I I II I I I I I I I II I I I I I I I M I I I 

Db 1033 GC CAGC GC C GGCAT CT AC CGC GGAC CC GTGT AT GC C CTGC AGGACT C CAC C GACAAAAT C 1092 

Qy 1375 CCCAGCCCCAAGTTCCAGCTCACCA — 1399 

I I I I I I I I I I I I I I I I II 
Db 1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 

Qy 1400 -ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC ACACA 1440 

I II II I I I I I I I I I I I I I I I 

Db 1153 TCCAGCACCACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGGGTCTTG 1212 

Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

III I I I I I I I I I I I I I I I I I I I I I I 

Db 1213 CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 1272 

Qy 1501 AACTACTTCCGCTC CCT GC C C CGAGGCACCAGCAACATGAC CT AT 1545 

I I I I I I I M I I I I I I I II I I I I I I I 

Db 1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGGGAGCAGCGTCAGC 1332 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

M II II I I I I I I I I I I II I I I I I I I I Mill I I II I I I I 

Db 1333 GGCACCTTTGGCTGCCTGGGTGGGAGGCTCAGCATCCCCGGCACAGGGGTCAGCTTGCTG 1392 

\ 

Qy 1606 AT C CCCCCAGAT GC CAT ACCCC GAGGGAAGAT CT AT GAGAT CT ACCT CACGCT GC ACAAG 1665 

I I II I I I I I I II I I I I I I I I I M I I M I I I II I I I I II 

Db 1393 GT GCCCAAT GGAGC C ATT C CCCAGGGCAAGTTCT AC GAGATGT AT CT ACT CAT CAAC AAG 1452 



Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I II I I I I I I I I I I I I I I I t I I I I I 

Db 1453 GCAGAAAGTAC CCT C C C GCTTT C AGAAGGGACCCAGAC AGT ATT GAGCC C CT CGGT GAC C 1512 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1513 TGTGGACCCACAGGCCTCCTGCTGTGCCGCCCCGTCATCCTCACCATGCCCCACTGTGCC 1572 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

II III I I I I I I I I I I II I I I I II I I I I I I I I I I I 

Db 1573 GAAGT CAGTGCCC GT GACTGGAT CTT T C AGCTCAAGACC C AGGC CCAC CAGGGC CACT GG 1632 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1633 GAGGAGGTGGT GAC C CT GGAT GAGGAGACC CT GAACACAC C CT GCT ACT GC C AGCT GGAG 1692 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 1752 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1753 TATTCCCGCTCAGCAGTCAAGCGGCTCCAGCTGGCCGTCTTCGCCCCCGCCCTCTGCACC 1812 

Qy 2026 T CCCT C GAGT ACAACAT C CGGGT CT ACT GC CT GC AT GACAC CCAC GAT GCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1813 TCCCTGGAGTACAGCCTCCGGGTCTACTGCCTGGAGGACACGCCTGTAGCACTGAAGGAG 1872 

Qy 2086 GT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGT C CTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I II 
Db 1873 GTGCTGGAGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATG 1932 

Qy 214 6 TT CAAGGACAGTT ACC ACAAC CT GCGC CTAT CCAT C CACGATGT GCCCAGCT CC CT GT GG 2205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I III III III 

Db 1933 TTCAAGGACAGTTACCACAACCTGCGCCTCTCCCTCCATGACCTCCCCCATGCCCATTGG 1992 

Qy 2206 AAGAGTAAGCT CCTT GT CAGCT ACCAGGAGATC CC CTTTT ATCACAT CT GGAAT GGCACG 2265 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1993 AGGAGCAAGCT GCT GGC CAAAT ACCAGGAGAT C C C CTT CT ATCAC ATTT GGAGT GGC AGC 2052 

Qy 2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 

Db 2053 CAGAAGGCCCT CCACTGCACTTTCACCCTGGAGAGGCACAGCTT GGCCTCCACAGAGCTC 2112 

Qy 2326 GCCT GCAAGCT GT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCT T C AGC AT CAACTT C 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 

Db 2113 ACCT GCAAGAT CT GCGT GCGGCAAGT GGAAGGGGAGGGC CAGAT AT T C CAGCT GCAT ACC 2172 

Qy 2386 AAC AT C AC C AAG GACACAAGGTT T GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGG 2442 

I I I I I III II II I II 

Db 2173 ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 

Qy 2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

% I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2233 GT CACCAC CC AGCT GGGACCT TAT GC CTTCAAGAT C C CACT GT CC AT C C GC CAGAAGAT A 2292 



Qy 2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2293 T GCAACAGCCT AGAT GC C CCCAACT CACGGGGCAAT GACT GGC GGATGTT AGC AC AGAAG 2352 

Qy 2563 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2622 

III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2353 CTCTCTATGGACCGGTACCTGAATTACTTTGCCACCAAAGCGAGCCCCACGGGTGTGATC 2412 

Qy 2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II 

Db 2413 CT GGAC CT CT GGGAAGCT CT GC AGCAGGAC GAT GGGGAC CT CAAC AGC CT GGC GAGT GCC 2472 

Qy 2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

IN I Mill II II I I I I I I I I I I I I I I 

Db 2473 TT GGAGGAGAT GGGCAAGAGT GAGAT GCT GGT GGCT GTGGCCACC GAC GGGGACT GCT GA 2532 
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/organism="Mus musculus" 
/mol_type="genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>2532 

/ locus_tag= "HCM4 327" 



Query Match 28.4%; Score 780.4; DB 9; Length 2532; 

Best Local Similarity 60.1%; Pred. No. 5.8e-154; 

Matches 1515; Conservative 0; Mismatches 876; Indels 129; Gaps 8; 

Qy 352 GAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATAC 411 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 13 GAGGT GCAGAT CGAGGT GT CAC GGCAGCAAGT GGAGGAACT CTT C GGGCT C GAGGACT AC 72 

Qy 412 TGGT GCCAGT GC GT GGC AT GGAGCT CCTC GGGCAC CAC CAAGAGT CAGAAGGCCT AC AT C 471 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 73 TGGTGCCAGTGCGTGGCCTGGAGCTCTTCGGGAACTACCAAGAGTCGCCGAGCCTACATC 132 

Qy 472 C GCAT AGC CAGATT GCGCAAGAACT T C GAGCAGGAGC CGCT GGCCAAGGAGGT GT CCCT G 531 

I II I I III I I I I I II I I II I I I II II I I I I I I I I I I I I I I I II I I I II II 
Db 133 CGCATTGCCTACTTGCGCAAGAACTTTGACCAGGAGCCTCTGGCCAAGGAGGTACCCTTG 192 

Qy 532 GAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAG 591 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 193 GATCATGAGGTCCTTCTGCAGTGCCGCCCACCGGAGGGAGTGCCTGTGGCTGAGGTGGAA 252 

Qy 592 TGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGG 651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 253 TGGCTCAAGAAT GAAGATGTCATTGACCCCGCTCAGGACACTAACTT CCT GCTCACCATT 312 

Qy 652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 313 GACCACAACCT CAT CATCCGCC AGGC GCGCCT CT CAGACACGGCCAACT ACACCT GT GT G 372 

Qy 712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I 

Db 373 GCCAAGAATATCGTGGCCAAGCGCCGGAGCACCACGGCCACAGT CATCGT CT AT GTGAAT 432 

Qy 772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 

Db 433 GGAGGCTGGTCCAGCTGGGCAGAGTGGTCACCCTGTTCCAATCGCTGTGGCCGAGGCTGG 492 

'Qy 832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 493 CAGAAGC GT ACT C GGACCT GCACCAAT C CAGC CCC ACT CAAT GGAGGCGC CTTCT GT GAG 552 

Qy 892 GGGC AGAATGT C CAGAAAACAGCCT GC GCCACCCT GT GCCC AGT AGACGGCAGCT GGAGC 951 

I I I I I I I I I I II I I I II II I I I I I I II I I I I I I II II I I I II I I 

Db 553 GGACAGGCCTT CCAGAAGACAGCT T GCAC CACC GT GT GCCCAGT GGAT GGAGCGT GGAC C 612 

Qy 952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 613 GAGT GGAGCAAGT GGT CT GCCT GC AGCACAGAGT GT GCGCACT GGCGCAGC CGCGAGT GC 672 

Qy 1012 T CT GACC C AGC AC CCCGCAAC GGAGGGGAGGAGT GC CAGGGCACTGAC CT GGACACC C GC 1071 

I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 673 AT GGCAC CGCCACCC CAGAAC GGAGGC CGT GACTGCAGCGGGAC GCTACT T GACT CCAAG 732 

Qy 1072 AACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGAC 1119 

I I I I I II II I I II III I I I I III 

Db 733 AACT GCACTGAT GGGCT GT GCGT GCT GAAT CAGAGAACTCTAAAC GACCCTAAAAGC CAC 792 

Qy 1120 GTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGC 1158 



Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



793 



1159 



853 



I I I I I I I I I I I I I I I II I III 

CCCCTGGAGACATCGGGAGATGTGGCACTGTACGCAGGCCTTGTGGTGGCCGTCTTTGTG 



852 



CTGGTCCTGCTGCTGCTTGTCCT CATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 1215 

I I I I I I I I I I I I I I I I I I I I I I I II I 

GT GGTAGCGGTT CT CAT GGCCGT GGGAGT GATC GTAT AC C GGAGAAACT GCC GGGACTT C 912 



1216 GACTCAGAT GT GGCT GACT CGT CCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATC 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

913 GACACGGACATCACCGACTCCTCTGCGGCCCTCACTGGTGGCTTCCACCCTGTCAACTTC 



972 



1273 AAGCCCAGCAAAGCAGACAAC CC C CAT CTGCT CACCATCCAGCCGGACCTCAGC 1326 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

973 AAGACTGCAAGGCCCAACAACCCGCAGCTCCTGCACCCGTCCGCCCCTCCAGACCTAACG 1032 

1327 AC C ACCACCAC C ACCT AC CAGGGCAGT CTCT GT C CC C GGCAGGAT GG 1373 

III I I I I I I I I II I I I I I I I I I I I I I 
1033 GC CAGT GCT GGCAT CT AC C GC GGGCCT GTGT AT GCC CTGCAGGACT CC GCC GACAAGAT C 1092 

1374 GC CCAGC CCCAAGT T C CAGCT CACCAAT 1401 

I I I I I I I I I I I I II II II II 
1093 CCCAT GACTAATT CGCCC CT GCT GGAT CCC CTGC CCAGC CTCAAGAT CAAGGT CT ATAAC 1152 

1402 GGGCACCTGCTCAG CCCCCTGGGTGGCGGC 1431 

I III I I I I I I I I I I I 

1153 TCCAGCACCATCGGTTCTGGGTCTGGCCTGGCTGATGGAGCCGACCTGCTGGGTGTCCTC 1212 

1432 CGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTC 14 91 

II I I I I I I I I I I I I I I I I I III 

1213 CCGCCGGGCACGTACCCAGGCGATTTCTCCCGGGACACCCATTTCCTGCACCTGCGCAGT 



14 92 TCCACCCAGAACT ACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 

I I I II I M ill I I I I I I I I I I I I I I I I I I 

1273 GCCAGCCTTGGTTCCCAGCACCTCCTGGGCCTACCTCGGGACCCCAGCAGCAGTGTCAGC 



1272 



1545 



1332 



1546 GGGAC CTT CAACTT CCT CGGGGGCC GGCT GATGATCC CTAAT ACAGGTAT CAGC CT C CT C 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

GGCACCTTTGGTTGCCTGGGAGGAAGGCTGAGCCTCCCCGGCACAGGGGTCAGCCTGTTG 1392 



1333 



1606 AT C CCC CCAGAT GCCAT AC CCC GAGGGAAGATCTAT GAGATCTAC CTCACGCT GCACAAG 
III I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

GT ACCAAAT GGAGC CATT CCCCAGGGCAAGTTCTAT GAC CTGT AT CTACATATCAACAAG 



1393 



1666 



1453 



CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 

I III I I II III II I I I I I I I I I I I Mil 

GCC GAAAGCAC CCT C C C ACTTT CAGAAGGTT CC CAGACAGTAT T GAGCCC CT CGGT GAC C 



1665 



1452 



1725 



1512 



1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

II II I II I I I I I I I I II II I II I M M II I II I II II II I 
1513 TGTGGGCCCACAGGCCTACTCCTGTGCCGCCCTGTCGTCCTCACCGTGCCCCACTGTGCT 



1572 



1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

II II I I M M I M I I I I II I I I Mil Mill II II 

1573 GAAGT CAT C GCT GGAGACT GGAT CT TT CAGCTCAAGACC CAGGCCCAT CAGGGCCACT GG 1632 

1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 
M II I II I II I II I II I I II I I I I I I I II M I I I II II I I I II 



1633 GAGGAGGT GGT GAC CTT GGAT GAGGAGACCCT CAAC ACACCCTGCT ACT GCC AGCT GGAG 1692 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1693' GCTAAGTCCTGCCACATCCTGCTGGACCAGCTGGGTACCTACGTATTCATGGGCGAGTCC 1752 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1753 TACTCTCGCTCTGCAGTCAAGCGGCTCCAGCTGGCCATCTTCGCCCCAGCCCTCTGCACC 1812 

2026 T C C CT C GAGT ACAACAT C C GGGT CT ACT GC CTGCAT GAC AC CCACGAT GCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1813 T CC CTGGAGT AT AGCCT C AGGGT CT ACT GT CTGGAGGAC ACACCT GT AGCACT GAAGGAG 1872 

2086 GT GGT GC AGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGT C CT GCAC 2145 

II I I I I I I I II I I I I I I I I I I I III I I I I I I I I III I 
1873 GTCCTGGAGCTGGAGAGGACTCTGGGTGGCTACTTGGTGGAGGAGCCCAAGCCTTTGCTC 1932 

2146 TT CAAGGACAGTT AC CACAACCT GC GCCT AT CCAT C CAC GAT GT GC C CAGCT CCCT GT GG 2205 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

1933 T TTAAGGACAGTTAC CACAACCTAC GCCT CT CC CT C CAT GACAT C CCCCAT GCCCACT GG 1992 

2206 AAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT C CC CTTTT AT CAC AT CT GGAAT GGC AC G 2265 

I III II II II I II I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I 
1993 AGGAGCAAACT ACT GGC CAAGT AC CAGGAGATT CCCTTCT AC CAC GT CT GGAAT GGCAGC 2052 

2266 CAGC GGTACTT GCACTGCACCTT CAC CCT GGAGC GT GT CAGCCCCAGCACT AGT GACCT G 2325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I 

2053 CAGAGAGCC CT GCACTGCACTT T CACCCT GGAGAGGCAT AGCCT GGC CT CCACGGAGT T C 2112 

2326 GC CT GCAAGCT GT GGGT GT GGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGC AT CAACTT C 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II 

2113 AC CT GTAAGGT CT GC GT GC GGC AGGT CGAAGGGGAAGGCC AGAT T TT CCAGCT GC AC ACA 2172 

238 6 AACATCACC AAGGACACAAGGTTTGCT GAGCTGCTGGCT CT GGAGAGTGAAGCGGGG 2442 

I I I I I I III II II I I I 

2173 ACGTTGGCCGAGACGCCTGCTGGCTCCCTGGATGCTCTCTGCTCTGCCCCGGGCAATGCC 2232 

2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I III I I I I I III I I I I I I I I I I I I III I III II II Mill 
2233 AT CAC CAC C CAGCT GGGACC CTAT GCCTT CAAGAT AC C CCT GT CCAT CC GC CAAAAGAT C 2292 

2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I 

2293 TGCAGCAGCCTGGACGCCCCCAACTCCCGGGGCAACGACTGGAGGCTGTTGGCGCAGAAG 2352 

2563 CTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATC 2622 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
2353 CT GT CCAT GGAC CGGT ACCTAAACTACT T CGCC AC CAAAGCT AGT C C CACAGGT GT CAT C 2412 

2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2413 T TAGAC CT CT GGGAAGCT CGGCAACAGGAT GACGGGGAC CT CAAC AGCCT GGCCAGT GC C 2472 

2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

III I I I II I I I II I II I I I I I I I I I I I I I 

2473 TT GGAGGAGAT GGGCAAGAGTGAGAT GCT GGTAGCC AT GGC CAC AGAT GGC GATT GCT GA 2532 
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FEATURES 

source 



BI758231 1034 bp mRNA linear EST 25-SEP-2001 

603029876F1 NIH_MGC_114 Homo sapiens cDNA clone IMAGE : 5200171 5', 
mRNA sequence. 
BI758231 

BI758231.1 GI:15749809 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1034) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs~r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/ LLNL at: 
http : //image . llnl . gov 

Plate: LLAM11501 row: g column: 20 
High quality sequence stop: 793. 

Location/Qualifiers 

1. .1034 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone=" IMAGE: 5200171" 

/lab_host="DH10B" 

/ clone_lib= "NI H_MGC_1 14" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: NotI ; 
Site_2 : EcoRV (destroyed); RNA source anonymous pool of 6 
male brains, age range 23-27 yo. Library is oligo-dT 
primed and directionally cloned (EcoRV site is destroyed 
upon cloning). Average insert size 1.5 kb, insert size 
range 1-3 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 019. Note: 
this is a NIH_MGC Library." 



ORIGIN 



Query Match 27.9%; 
Best Local Similarity 91.2%; 
Matches 918; Conservative 



Score 768.6; DB 4; 
Pred. No. 1.6e-151; 
0; Mismatches 74; 



Length 1034; 
Indels 15; Gaps 



9; 



Qy 

Db 



150 GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 209 

I I I I I I III I II I III II I I I I I I I I II I II II II I I I I I I II III I M I M I II II II I 
1 GCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACAT 60 



Qy 210 CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 269 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 61 CGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTT 120 

Qy 270 CAAGTGCAACGGGGAGTGGGT GCGC CAGGT GGACCACGT GAT CGAGCGCAGC ACAGAC GG 329 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 121 CAAGT GCAAC GGGGAGTGGGT GCGC CAGGT GGACC AC GT GAT CGAGCGCAGC ACAGAC GG 180 

Qy 330 GAGC AGT GGGCT GCCC ACCAT GGAGGT C C GC ATTAAT GT CT CAAGGCAGCAGGT C GAGAA 389 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GAGCAGT GGGCT GCCC ACCAT GGAGGT C C GC ATTAATGT CT CAAGGCAGCAGGT C GAGAA 240 

Qy 390 GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 449 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCAC 300 

Qy 450 CAAGAGTCAGAAGGCCTACATCCGCATAGCCAGATT GCGCAAGAACTT CGAGCAGGAGCC 509 

II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db '301 CAAGAGTCAGAAGGCCTACATCCGCATAGCCTATTT GCGCAAGAACTT CGAGCAGGAGCC 360 

Qy 510 GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 569 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGG 420 

Qy 570 CATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGA 629 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGA 480 

Qy 630 CCCCAATGT AT ACAT CACGC GGGAGCACAGC CT GGT GGT GC GAC AGGCCC GCCTTGCT GA 68 9 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 481 CCC CAAT GT AT ACAT CACGCGGGAGCAC AGC CT GGT GGT GC GAC AGGCCC GCCTTGCT GA 540 

Qy 690 CACGGCCAACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGC 749 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CAC GGACAACT ACAC CT GC GT GGC CAAGAAC AT C GT GGC AC GTC GCC GCAGCGC CT C C G C 600 

Qy 750 TGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGA-CGTGGACCGAGTGGTCCGTCTGCA 808 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 601 TGCTGT CAT CGTCTACGTGAACGGTGGGT GGT CGACCGT GGACC GAGT GGT CCGTCTGC- 659 

Qy 809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I I I I I I I I I I I I II I II I I I I I II I I I I I I I II II I I I I I I I I I I I 

Db 660 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACCGGAGCCGGAGCTGCACAACCCGGTGCCTC 719 

Qy 869 TCAACGGGGGCGCTTTCTGTGA-GGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTG 927 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I II II 

Db 720 T CAACGGGGGCGCTTT CT GT GAGGGGGC AGAAT GT C C AGAAAGCAGC TGCGCCACCT 776 

Qy 928 TGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGT — GGGCT GGACT 985 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I II I I I II III I 
Db 777 GTGCCAGTGGACGGCAGCTGTAGCACGTGGAGCCAGTGGTCGGCCTGTTGGGCTTGGCTT 836 

Qy 986 GCACCCACT — GGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGA 1043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 837 GCACCCACTTGGGCGGAGCCGGAGTGCTCTGAACCCAGCACCCCGGCACGGCAGGGGGAG 896 

Qy 1044 GTG C CAGGGCACT GAC CT GGACAC C CGCAACT GT AC C AGT GACCT CT GTGT AC AC AG 1100 

III I I I I I I I I I I I I I I I I I I III I I I I I I I I I II I I I I I I I 



Db 897 GTGTGCCCAGGTCACTGGACCTGGCACCCGGGA-TGGTCCAGTGAGCTCTGTGT-CCCAC 954 

Qy 1101 TGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTCATCGCCG 1147 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 955 GGGTTCTGGCCCTGAGGACTTGGCCTCCTATGTGGGCCTCATCCCGG 1001 
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BC033727 1532 bp ■ mRNA linear HTC 25-MAR-2004 

Homo sapiens unc-5 homolog A (C. elegans), mRNA (cDNA clone 
IMAGE: 5166762) , containing frame-shift errors. 
BC033727 

BC033727. 1 GI: 21707230 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1532) 

Strausberg, R. L. , Feingold, E . A. , Grouse, L.H., Derge,J.G., 
Klausner, R. D. , Collins, F. S . , Wagner , L. , Shenmen, C .M. , Schuler , G. D. , 
Altschul, S . F. , Zeeberg,B., Buetow,K.H., Schaef er, C . F. , Bhat,N.K., 
Hopkins, R. F. , Jordan, H., Moore, T., Max,S.I., Wang, J., Hsieh,F., 
Diatchenko, L. , Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Stapleton,M. , Soares,M.B., Bonaldo,M. F. , Casavant, T. L. , 
Scheetz,T. E. , Browns tein,M. J. , Usdin, T. B. , Toshiyuki, S. , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters, G. J., 
Abramson, R. D. , Mullahy, S . J. , Bosak,S.A., McEwan,P.J., 
McKernan, K. J. , Malek,J.A. , Gunaratne, P.H. , Richards, S., 
Worley,K.C, Hale,S., Garcia, A. M. , Gay,L.J., Hulyk,S.W., 
Villalon, D. K. , Muzny,D.M., Sodergren, E. J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M., Madan,A., Rodrigues , S . , 
Sanchez, A., Whiting, M., Madan,A. , Young, A. C, Shevchenko, Y. , 
Bouf fard, G. G. , Blakesley, R.W. , Touchman, J. W. , Green, E. D. , 
Dickson, M. C. , Rodriguez, A. C . , Grimwood,J., Schmutz, J. , Myers, R.M., 
Butter f ield, Y. S . , Krzywinski,M. I . , Skalska, U. , Smailus, D. E. , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 
12477932 

2 (bases 1 to 1532) 
Strausberg, R. 
Direct Submission 

Submitted ( 02- JUL-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 



Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact : nisc_mgc@nhgri . nih . gov 

Akhter, N . , Ayele, K . , Beckstrom-Sternberg, S .M. , Benj arnin, B. , 
Blakesley, R.W. , Bouf f ard, G. G. , Breen,K., Brinkley,C, Brooks,S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q. L. , Masiello, C. , Maskeri, B. , Mastrian, S . D. , McCloskey, J. C . , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas, P . J. , Touchman, J. W . , 
Tsurgeon^C, Vogt f J.L., Walker ,M. A. , Wetherby, K. D. , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 

Clone distribution: MGC clone distribution information can be found 
through the LM.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 68 Row: i Column: 2 

This clone was selected for full length sequencing because it 
passed the following selection criteria: GenomeScan gene prediction 
This clone has the following problem: frame shifted. 
FEATURES Location/Qualifiers 
source 1. .1532 

/organism="Homo sapiens" 

/mol_type= "mRNA" 

/db_xref="taxon: 9606" 

/ clone= " IMAGE :5166762" 

/tissue_type="Brain, adult medulla" 

/clone_lib="NIH_MGC_119" 

/lab_host="DH10B" 

/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 26.8%; Score 736.6; DB 3; Length 1532; 

Best Local Similarity 84.2%; Pred. No. 9.7e-145; 

Matches 917; Conservative 0; Mismatches 4; Indels 168; Gaps 1; 

Qy 337 GGGCT GCCCACCAT GGAGGT CCGCATT AAT GT CT CAAGGCAGCAGGTC GAGAAGGTGTT C 396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
Db 612 GGGCT GCCCACCAT GGAGGT CCGCATTAAT GT CT CAAGGCAGCAGGTC GAGAAGGTGTT C 671 

Qy 397 GGGCT GGAGGAAT ACT GGT GCCAGT GC GT GGCAT GGAGCTCCT C GGGCAC CAC CAAGAGT 456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 672 GGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGT 731 

Qy 457 CAGAAGGCCT ACAT CC GCAT AGCCAGATTGCGCAAGAACTT C GAGC AGGAGC C GCTGGC C 516 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 
Db 732 CAGAAGGCCTACAT CC GCAT AGCCT ATT T GCGCAAGAACTT C GAGCAGGAGC CGCT GGC C 791 

Qy 517 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 792 AAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCT 851 

Qy 577 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 636 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I . 
Db 852 CCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAAT 911 



Qy 

Db 



637 
912 



GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
GTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCC 



696 
971 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



697 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

972 AACTACACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTC 1031 

757 ATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGC 816 
I I I I I I I I I I I I 

1032 ATCGTCTACGTG 1043 

817 TGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGG 876 

1044 1043 

877 GGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTA 936 

1044 1043 



937 



996 



GACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1044 GACGGCAGCT GGAGC CCGT GGAGCAAGT GGT CGGC CT GT GGGCT GGACT GCACCCACT GG 1103 

997 CGGAGCCGT GAGT GCTCT GACC CAGC AC C C C GCAACGGAGGGGAGGAGT GC C AGGGCACT 1056 

1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 

1104 C GGAGC C GT GAGT GCTCT GACC CAGC AC C C C GCAAC GGAGGGGAGGAGT GC C AGGGCACT 



1163 



1057 GACCT GGACACCCGCAACT GT AC CAGT GAC CTCT GT GT AC AC AGT GCTT CT GGC C CT GAG 1116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1164 GACCT GGACACC C GCAACT GT AC CAGT GACCTCT GT GTACACACT GCTTCT GGC C CT GAG 1223 

1117 GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 1176 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

GACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTT 



1224 



1283 



1236 



1177 GTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCG 
I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1284 GT CCTCAT CCTCGTT TATT GCC GGAAGAAGGAGGGGCT GGACT CAGATGT GGCT GACT CG 1343 

1237 TCCATT CT CAC CT CAGGCTT CCAGC C CGT CAGCAT CAAGC C C AGCAAAGCAGACAAC CCC 1296 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1344 T CC ATT CT CACCT CAGGCT T CCAGC C CGT CAGCAT CAAGCC CAGCAAAGC AGACAAC CCC 1403 

1297 CAT CT GCT CACCAT CCAGC CGGACCTCAGCAC CAC CAC CAC CAC CT ACCAGGGCAGT CTC 1356 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1404 CAT CT GCT CAC CAT CCAGCC GGACCT C AGCACCAC CAC CAC CAC CT ACCAGGGCAGT CT C 1463 

1357 TGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGC 1416 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1464 T GTC CC CGGCAGGATGGGC CCAGC CCCAAGTTCCAGCT CAC CAATGGGCACCT GCT CAGC 1523 



1417 CCCCTGGGT 1425 

I I I I I I I I I 
1524 CCCCTGGGT 1532 



RESULT 11 

AI951556 

LOCUS 



AI951556 



788 bp mRNA linear EST 09-MAR- 



2000 



DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 

source 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



(CGAP) , 



wv36f04.xl NCI_CGAP_Ovl8 Homo sapiens cDNA clone IMAGE: 2531647 3 1 
similar to TR:O08721 008721 TRANSMEMBRANE RECEPTOR UNC5H1. ;, mRNA 
sequence . 
AI951556 

AI951556.1 GI:5743866 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 788) 

NCI-CGAP http : //www. ncbi . nlm. nih . gov/ncicgap . 
National Cancer Institute, Cancer Genome Anatomy Project 
Tumor Gene Index 
Unpublished (1997) 
Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-rdmail . nih . gov 

Tissue Procurement: Christopher A. Moskaluk, M.D., Ph.D., Michael 
R. Emmert-Buck, M.D., Ph.D. cDNA Library Preparation: M. Bento 
Soares, Ph.D. cDNA Library Arrayed by: Christa Prange, The 
I.M.A.G.E. Consortium DNA Sequencing by: Washington University 
Genome Sequencing Center 

Clone distribution: NCI-CGAP clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
www-bio . llnl . gov/bbrp/ image /image . html 
Insert Length: 1125 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 446. 

Location/Qualifiers 

1. .788 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 2531647" 
/tissue_type="f ibrotheoma" 
/lab_host="DH10B (phage-resistant ) " 
/ clone_lib= "NCI_CGAP_Ovl 8 " 

/note="Organ: ovary; Vector: pT7T3D-Pac (Pharmacia) with a 
modified polylinker; Site_l: Not I; Site_2: Eco RI; 1st 
strand cDNA was primed with a Not I - oligo(dT) primer [5 ! 
TGTTACCAATCTGAAGTGGGAGCGGCCGCGCGACATTTTTTTTTTTTTTTTTT 3 1 ] ; 
double-stranded cDNA was ligated to Eco RI adaptors 
(Pharmacia), digested with Not I and cloned into the Not 
I and Eco RI sites of the modified pT7T3 vector. Library 
went through one round of normalization, and was 
constructed by Bento Soares and M. Fatima Bonaldo. " 



ORIGIN 



Query Match 26.7%; 
Best Local Similarity 96.5%; 
Matches 749; Conservative 



Score 735.2; DB 1 
Pred. No. 1.8e-144 
0; Mismatches 27 



Length 788; 

Indels 0; Gaps 0; 



Qy 1469 CCGAGGAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 1528 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1 CCGAGGAGTTCGTCTCCCGCCTCTCCGCCCAGAACTACTTCCGCTCCCTGCCCCGAGGCA 60 



Qy 1529 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 1588 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CCAGCAACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATA 120 



Qy 1589 CAGGTATCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCT 164 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGGAATCAGCCTC CT CAT CCCC C CAGAT GC CAT AC C CC GAGGGAAGAT CT AT GAGAT CT 180 

Qy 1649 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 1708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 ACCTCACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGC 240 

Qy 1709 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGG 1768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 241 TGAGTCCCATCGTTAGCTGTGGACCCCCTGGCGTTCTGCTCACCCGGCCAGTCATCCTGG 300 

Qy 1769 CTATGGACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGT 1828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CT AT GGACC ACT GT GGGGAGCC CAGC C CT GACAGCT GGAGCCT GC G CCT CAAAAAGC AGT 360 

Qy 1829 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 1888 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 CGTGCGAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCT 420 

Qy 1889 ACTACTGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTG 1948 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 421 ACT ACT GCCAGCTGGAGGCC AGT GC CT GCT AC GT CT T CAC CGAGC AGCT GAGCCGCT AT G 4 80 

Qy 1949 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 2008 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 CCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTG 540 

Qy 2009 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATCCGGGTCTACTGCCTGCATGACACCC 2068 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CGCCGGTGGCCTGCACCTCCCTCGAGTACAACATACTGGTCTACTGCCTGCATGACACTC 600 

Qy 2069 ACGATGCACTCAAGGAGGTGGTGCAGCT GGAGAAGC AGCT GGGGGGAC AGCT GATCCAGG 2128 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AC GAT GCACTCAACGT AGTGGT GC AGCT GGAGAAGC AGCT GCAGGGAC AGCT GAT C C AGG 660 

Qy 2129 AGCCACGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATG 2188 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 AGCCACTGGTACTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATNCATCCACGATG 720 

Qy 2189 TGCCCAGCT CCCTGT GGAAGAGTAAGCT CCTTGT CAGCT ACCAGGAGAT CCC CTT T 2244 

I I I II II I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I I II I 

Db 721 T GCCCAGCTNC CNT GT GGAGAGTAAGCT T CT T GT CAGCT ACC CAGAGAT CCNCT AT 776 



RESULT 12 
BX348193/C 

LOCUS BX348193 796 bp mRNA linear EST 08-APR-2004 

DEFINITION BX348193 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 

cDNA clone CS0DB008YE02 5-PRIME, mRNA sequence. 

ACCESSION BX348193 

VERSION BX348193.2 GI:46286231 

KEYWORDS EST . 

SOURCE Homo sapiens (human) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 796) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 5, 2003 this sequence version replaced gi: 30367258. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 -.91057 EVRY cedex - FRANCE 
Email: seqref ©genoscope . ens . f r , Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
3239. r 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CSOBAF004ZD01_AF00293_l&c=3239 . r 



FEATURES 

source 



Location/Qualifiers 
1. .796 

/organism= ,f Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB008YE02" 

/ tissue_type= "NEUROBLASTOMA COT 10 -NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10 -NORMAL I ZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized. " 



ORIGIN 



Query Match 26.2%; 
Best Local Similarity 96.4%; 
Matches 758; Conservative 



Score 721.6; DB 5; 
Pred. No. 1.3e-141; 
0; Mismatches 26; 



Length 796; 
Indels 2; 



Gaps 



2; 



Qy 1679 GGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTG 1738 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 7 95 GTTGCCCCAAACCGGGCTGTCAGACCCTGTTGAGTCCCATGGTTAGCTGTGAA-CCCCTG 737 



Qy 1739 GCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTG 1798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 736 GCGTCCTGCTCACCGGCCCAGTCATCCTGGGTATGGACCACTGTGGGGAGCCCAGCCCTG 677 

Qy 1799 ACAGCTGGAGCCTGCGCCTC-AAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTG 1857 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 676 ACAGCTGAGGC CT GCGCCT CAAAAAAACAGT C GT GC GAGGACAGCT GGGAGT AT GT CCT G 617 

Qy 1858 CACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGC 1917 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 616 CACCTGGGCGAGNAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGC 557 



Qy 



1918 TACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCT 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 



1977 



Db 



556 TACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCT 



497 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 



1978 GCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTAC 2037 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

GCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTAC 



496 



437 



2038 AACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTG 2097 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACAT CCGGGT CT ACT GCCT GC AT GACACCCACGAT GC ACT CAAGGAG GT GGT GCAGCT G 377 



436 



2098 GAGAAGCAGCT GGGGGGACAGCT GATCCAGGAGC C AC GGGT C CT GCACTTCAAGGACAGT 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAAGCAGCT GGGGGGACAGCT GATCCAGGAGC C AC GGGT C CT GCACTT CAAGGACAGT 



376 



2158 



316 



2218 



256 



2278 



196 



2338 



136 



2398 



76 



T AC C ACAAC CT GC GCCTATC CAT C C AC GAT GT GC C C AGCTCC CT GT GGAAGAGTAAGCT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T ACCACAAC CT GCGCCTATCCAT C C AC GAT GT GC C CAGCTCC CT GT GGAAGAGTAAGCT C 

CT T GTCAGCT AC CAGGAGATCCC CTTTT AT CACAT CT GGAAT GGC ACGCAGCGGT ACT T G 

I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTT GTCAGCT AC C AGGAGATCC C CTTTT AT CACAT CT GGAAT GGCACGCAGC GGT ACTT G 

CACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTG 

TGGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCT T CAGCAT CAACTTCAACAT CAC CAAG 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGTGT GGCAGGT GGAGGGCGAC GGGCAGAGCTT CAGCAT CAACTTCAACAT CAC CAAG 

GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTG 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I II I 
GACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGNCCCTGGT 



2157 



317 



2217 



257 



2277 



197 



2337 



137 



2397 



77 



2457 



17 



2458 GGCCCC 2463 
II III 
16 GGGCCC 11 



RESULT 13 

BI818609 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BI818609 818 bp mRNA linear EST 04-OCT-2001 

603033362F1 NIH_MGC_115 Homo sapiens cDNA clone IMAGE: 5174559 5 f , 
mRNA sequence. 
BI818609 

BI818609.1 GI: 15929902 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 818) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 
Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r@mail . nih . gov 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



Tissue Procurement: Life Technologies, Inc. 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 
Plate: LLAM11434 row: 1 column: 16 
High quality sequence stop: 744. 
FEATURES Location/Quali f iers 

source 1. .818 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 5174559" 
/lab_host="DH10B" 
/clone_lib="NIH_MGC__115" 

/note="Organ: pooled brain, lung, testis; Vector: 
pCMV-SPORT6; Site_l: NotI; Site_2: EcoRV (destroyed); RNA 
source anonymous pool of 6 male brains, age range 23-27; 1 
male lung, age 27; and 1 male testis, age 69. Library is 
oligo-dT primed and directionally cloned (EcoRV site is 
destroyed upon cloning). Average insert size 1.8 kb, 
insert size range 1-3 kb. Library is normalized and 
enriched for full-length clones and was constructed by C. 
Gruber (Invitrogen) . Research Genetics tracking code 
021. Note: this is a NIH_MGC Library." 

ORIGIN 

Query Match 26.0%; Score 716.4; DB 4; Length 818; 

Best Local Similarity 97.7%; Pred. No: 1.7e-140; 

Matches 748; Conservative 0; Mismatches 16; Indels 2; Gaps 2; 



Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 CCGGAC CT GCTT C C C CACTT CCT GGT GGAGC CCGAGGAT GTGT ACAT C GT CAAGAACAAG 222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 121 CCGGAC CT GCTT CC C CACTT C CT GGT GGAGCC CGAGGAT GT GT ACATCGT CAAGAACAAG 180 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 240 

Qy 283 GAGTGGGT GCGC CAGGT GGAC C AC GT GAT CGAGC GCAGCACAGAC GGGAGCAGTGGGCT G 342 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GAGTGGGT GCGCC AGGT GGACC AC GT GAT CGAGC GCAGCACAGAC GGGAGCAGT GGGCT G 300 

Qy 343 C C CAC CAT GGAGGT C CGCATTAAT GT CT CAAGGC AGCAGGTC GAGAAGGTGTT CGGGCT G 4 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 301 CCCACCAT GGAGGT C CGCAT TAAT GT CT CAAGGCAGCAGGTCGAGAAGGT GTTCGGGCTG 360 



Qy 403 GAGGAAT ACT GGT GC CAGT GCGT GGC AT GGAGCTC CT C GGGC AC CACCAAGAGT C AGAAG 4 62 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGGAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT C CT C GGGCAC CACCAAGAGT C AGAAG 420 

Qy 463 GCCT ACAT CCGCATAGCCAGATT GC GCAAGAACTT CGAGCAGGAGCC GCT GGC CAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCT ACAT CCGC AT AGCCTATTTGC GCAAGAACTT CGAGCAGGAGCCGCT GGC CAAGGAG 4 80 

Qy 523 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 

Qy 583 GAGGT GGAGT GGCT CCGGAAC GAGGAC CTGGT GGAC C C GT CCCT GGAC CC CAAT GT AT AC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGGT GGAGT GGCT CCGGAAC GAGGAC CTGGTGGACC CGT CCCT GGAC CC CAAT GT AT AC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AT CAC GCGGGAGC ACAGCCT GGT GGT GC GACAGGC CCGCCTTGCT GACAC GGCCAACT AC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTC-GCCGCAGCGCCTCCGCTGCTGTCATCGT 761 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCAGCCGCAGGGCCTCCGCTGCTGTCATCGT 720 

Qy 762 CTACGTGAACGGTGGGTGGTCGACG-TGGACCGAGTGGTCCGTCTG 806 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CTACGTGGACGGCAGCTGGAGCCCGTTGGAGCCAGT GGT CGGGCTG 766 



RESULT 14 

BX364574 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX364574 853 bp mRNA linear EST 08 

BX364574 Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED Homo 
cDNA clone CS0DC023YB10 5-PRIME, mRNA sequence. 
BX364574 

BX364574.2 GI : 46286957 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia; Eutheria; 
1 (bases 1 to 853) 
Li, W.B. , Gruber,C. , 



-APR-2004 
sapiens 



Chordata; 
Primates ; 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 

and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 5, 2003 this sequence version replaced gi: 30368812. 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
3529. f 

For more information about this cluster, see 



http : //www. genos cope . ens . f r/cdna?s=CSlAC006ZF06QPl&c=3529 . f . 
FEATURES Location/Qualifiers, 
source 1. .853 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DC023YB10" 

/ tissue_type=" NEUROBLASTOMA COT 25-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 

Query Match 25.1%; Score 692; DB 5; Length 853; 

Best Local Similarity 99.0%; Pred. No. 2.4e-135; 

.Matches 703; Conservative 3; Mismatches 3; Indels 1; Gaps 1; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I : I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 145 CCGCRGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 204 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 205 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 264 

Qy , 121 CAGCAGAGT GCCACCGT GGC CAACC CAGT GCCT GGT GC CAACC CGGAC CT GCTT CCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I 
Db 265 CAGCAGAGT GCCACC GT GGC CAACC CAGT GCCT GGT GC YAACC C GGAC CT GCT T CCC C AC 324 

Qy 181 TT C CT GGT GGAGCCC GAGGAT GT GTACAT CGT CAAGAACAAGC CAGT GCT GCT T GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 325 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 384 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 385 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 444 

Qy 301 GACCACGTGATCGAGC GCAGC AC AGACGGGAGCAGT GGGCTGC C CAC CAT GGAGGTCCGC 360 

I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 445 GACCAC GT GATCGAGC GCA- S ACAGAC GGGAGCAGT GGGCT GC CCACCAT GGAGGT CC GC 503 

Qy 361 ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAATACTGGT GCC AG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 504 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCTGGAGGAAT ACT GGT GC C AG 563 

Qy 421 T GC GT GGCAT GGAGCT C CTCGGGC ACC AC CAAGAGT CAGAAGGC CT AC AT C C GC AT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 564 T GC GT GGCAT GGAGCT CCTCGGGCACC AC CAAGAGT CAGAAGGCCT ACAT C CGCAT AGCC 623 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 624 TATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 683 



Qy 



541 



ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



600 



Db 684 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 743 

Qy 601 AACGAGGACCT GGT GGAC C C GT C C CT GGACCCCAAT GT AT AC AT CACGC GGGAGCACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
Db 744 AACGAGGAC CTGGT GGAC CC GT CCCT GGAC C C CAAT GT AT ACAT CACGC GGGAGCACAGC 803 

Qy 661 CTGGT GGT GCGACAGGCCCGCCTTGCTGAC AC GGCCAACTACACCTGCGT 710 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 
Db 804 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGT 853 
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AY411748 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 
ORIGIN 



AY411748 2532 bp DNA linear GSS 12-DEC-2003 

Pan troglodytes HCM4327 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY411748 

AY411748. 1 GI: 39767716 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan. 

1 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu, F. , Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2532) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera, S. , Wang, G. , Zheng, X. H. , White, T. J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2532 

/organism="Pan troglodytes" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9598" 
<1. .>2532 

/locus_tag="HCM4327" 



Query Match 24.6%; 
Best Local Similarity 54.4%; 
Matches 1370; Conservative 



Score 678.2; DB 9; 
Pred. No. 2.2e-132; 
0 ; Mismatches 1021 ; 



Length 2532; 
Indels 129; Gaps 



9; 



Qy 



352 GAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATAC 411 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



13 GAGGTGCAGATCGAGGTGTCGCGGCAGCAGGTGGAGGAGCTCTTTGGGCTGGAGGATTAC 72 

412 TGGTGC CAGT GC GT GGCAT GGAGCT CCT CGGGCACCACCAAGAGT CAGAAGGC CTACAT C 471 

11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

73 TGGTGCCAGTGCGTGGCCTGGAGCTCTGCGGGCACCACCAAGAGTCGCCGAGCCTACGTC 132 

472 CGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTG 531 

Mill Ml 

133 CGCATCGCCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 192 

532 GAGCAGGGCAT C GT GCT GC C CT GC CGT C CAC CGGAGGGCATC C CT CCAGC C GAGGT GGAG 591 

Mill 

193 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTGGAA 252 

592 TGGCT C CGGAACGAGGAC CT GGT GGACC C GT C CCTGGAC C CCAAT GT AT AC AT CAC GC GG 651 

I I II II II I I M I I I I II II I II I II II M M I II I I 

253 TGGCT CAAGAATGAGGAT GT CAT CGACCCCACCCAGGACACCAACTTCCTGCTCACCATC 312 

652 GAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTG 711 

I I I I II I II I I II II II II I II II I I M M II II II II I II II II I I 
313 GACCACAACCTCATCATCCGCCAGGCCCGCCTGTCGGACACTGCCAACTATACCTGCGTG 372 

712 GCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAAC 771 

I I I II M M I I I I I M I Mill III II I M I I II II II I II I II I I I I 

373 GCCAAGAACATCGTGGCCAAACGCCGGAGCACCACTGCCACCGTCATCGTCTACGTGAAT 432 

772 GGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGG 831 

I I M I II M I I II I II II II I I MM I I II I II I I I II II 

433 GGCGGCTGGTCCAGCTGGGCAGAGTGGTCGCCCTGCTCCAACCGCTGTGGNNGANNCTGG 492 

832 CAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAG 891 

Mill II I Mill I I M II I I II I I II II I I II I I M II MM II I 

493 CAGAAGCGCACCC GGAC CT GC ACCAAC C C C GC C C CACTCAACGGAGGGNNNNTCT GC GAG 552 

892 GGGCAGAAT GT CC AGAAAAC AGCCT GC GCC AC C CT GT GCCCAGT AGAC GGC AGCT GGAGC 951 

II I I I I I I I MM 

553 GGCCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCGATGGGGCGTGGACG 612 

952 CCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGC 1011 

I I M I I I II II I I I I I I I II I I I II I I I I I I I I M I I I I I I I I I I I 

613 GAGTGGAGCAAGTGGTCAGC CT GCAGCACT GAGT GT GCCCACT GGCGT AGC C GC GAGT GC 672 

1012 TCT GACCCAGCACCCCGCAACGGAGGGGAGGAGT GC CAGGGCACT GACCT GGACAC CCGC 1071 

I II II II II I II I II M II II I I I I I II I II I 

ATGGCGCCCCCACCCCAGAACGGAGGCCGTGACTGCAGCGGGACGCTGCTCGACTCTAAG 732 



673 



1072 AACTGT AC CAGT GACCT CT GT GT ACAC AGT GCT T CT 

I II M II II I I I I I II I I 

AACTGCAC AGAT GGGCT GT GCAT G CAAAAT AAGAAAACT CT AAGCGACC C CAACAGCCAC 



733 



1108 



793 



1156 



853 



GGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC ATCGCCGTGGCCGTC 

I I I I II I I I I I II . I I I I I II I I I I I I II I II 

CTGCTGGAGGCCTCAGGGGATGCGGCGCTGTATGCGGGGCTCGTGGTGGCCGTCTTCNTG 

TGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTG 

I II I I II I I II I I I I II I I I I II I I 

GTCNTGGCAATCCTCATGGCGGTGGGGGTGGTGGTGTACCGCCGCAACTGCCGTGACTTC 



1107 



792 



1155 



852 



1215 



912 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



1216 GACT CAGAT GT GGCT GACT CGT C CATT CTCACCTCAGGCTTCCAGCCCGTCAGCATC 1272 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 

913 GACACAGACATCACTGACTCATCTGCTGCCCTGACTGGTGGTTTCCACCCCGTCAACTTT 972 

1273 AAGCCCAGCAAAGCAGACAACCCCCATCT GCT CACCATCCAGCCGGACCTCAGC 1326 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

AAGACGGCAAGGCCCAGCAACCCGCAGCTCCTACACCCCTCTGTGCCTCCTGACCTGACA 1032 



973 



1327 



AC CAC CACCAC CAC CT ACC AGGGC AGT CTCTGTCCCC GG CAGGAT GGG 

I I I I I I I I I I I I I II I I I I I I I I I I I I 

1033 GCCAGCGCCGGCATCTACCGCGGACCCGTGTATGCCCTGCAGGACTCCACCGACAAAATC 



1375 



1374 



1092 



CCCAGCCCCAAGTTCCAGCTCACCA — 1399 

I I I I I I I III II II II II 
1093 CCCATGACCAACTCTCCTCTGCTGGACCCCTTACCCAGCCTTAAGGTCAAGGTCTACAGC 1152 



1400 



1153 



ATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCC 

111111 I I I I II I I I I I I I I 

TCCAGCACTACGGGCTCTGGGCCAGGCCTGGCAGATGGGGCTGACCTGCTGGGAGTCTTG 



ACACA 1440 



1212 



1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

III I I I I I I I I I I I I I I I II I I II I 

CCGCCTGGCACATACCCTAGCGATTTCGCCCGGGACACCCACTTCCTGCACCTGCGCAGC 



1213 



1501 AACTACTTCCGCTC : C CT GC CCC GAGGC ACC AGCAAC AT GACCT AT 

I I I I I I I I I I I I I I I I I I I I III I 

1273 GCCAGCCTCGGTTCCCAGCAGCTCTTGGGCCTGCCCCGAGACCCAGNNAGCAGCGTCAGC 



1272 



1545 



1332 



1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I II 

1333 GGCACCTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGTCAGCTTGCTG 1392 

1606 ATCCCCCCAGATGCCATACCCCGAGGGAAGAT CTAT GAGATCTACCTCACGCT GCACAAG 1665 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

GT GCCCAAT GGAGCCATT CCC CAGGGCAAGTT CT AC GAGATGT AT CTACTCAT CAACAAG 1452 



1393 



1666 



1453 



1726 



1513 



CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I Ml II II I I I I I I I I I I I I I I I I I I I 

GCAGAAAGTACCCT CCCGCTTTCAGAAGGGACCCAGACAGTATTGAGCCCCT CAGTGACC 1512 

TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
TGTGGACCCACAGGCCTCCTGCTGTGCCACCCCGTCATCCTCACCATGCCCCACTGTGCC 1572 



1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 184 5 

II III I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

1573 GAAGT CAGT GC C CGT GACT GGAT CTTT CAGCT CAAGACC C AGGCC C ACCAGGGCCACT GG 1632 

1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 

1633 GAGGAGGT GGT GAC C CTGGAT GAGGAGAC C CT GAACACAC CCT GCT ACT GC CAGCT GGAG 1692 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

M il M i ll I I I I I I I I M M I I I I II I I I I I I II I I 

1693 CCCAGGGCCTGTCACATCCTGCTGGACCAGCTGGGCACCTACGTGTTCACGGGCGAGTCC 1752 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I III III I I I I I I I I I I I I I I I I I I I 

1753 TATTCCCNNNNNNCAGTCNNNNNGCTCCNGCTGGCCGTCTTNGCCCCTGCCCTCTGCACC 1812 

2026 T C CCTC GAGT ACAACAT CC GGGT CT ACTGC CT GCAT GACAC C CAC GAT GC ACT CAAGGAG 2085 

I I I I I II I I I I I I I I I I I I I I I I I I III 

1813 TCCCTGGANNNNNGCCTCCGGGTCTACTGCCTGGNNNNNNNNNNNNNNNNNNNNNNNGAG 1872 



2086 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGCCAC GGGT CCT GCAC 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
1873 GTGCTGGAGCTGGAGCGGACTCTGGGCGGATACTTGGTGGAGGAGCCGAAACCGCTAATG 

214 6 TT CAAGGAC AGTT ACCACAACCT GCGC CT AT C CAT C CAC GAT GT GCCC AG CT C CCT GT GG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Ml 

1933 TT CAAGGACAGTT AC CACAAC CT GC GC CT CT C CCT C CAT GACCT CCCC CAT GCCC AT T GG 

2206 AAGAGTAAGCT CCTTGT C AGCT ACC AGGAGAT CC C CT TT T AT CAC ATCT GGAATGGCACG 
I I I I II I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGAGCAAGCTGCTGGCCAAATACCAGGAGATCCCCTTCTGTCACATTTGGAGTGGCAGC 



1993 



2266 



2053 



CAGCGGT ACT T GCACT GCACCTT CACCCT GGAGCGT GT C AGC C C C AGCACT AGTGAC CT G 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 

CAGAAGGCCCTCCACTGCACTTTCACCCTGGAGAGGCACAGCTTGGCCTCCACAGAGCTC 



2145 



1932 



2205 



1992 



2265 



2052 



2325 



2112 



2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I 

AC CT GCAAGAT CT GCGT GCGGCAAGTGGAAGGGGAGGGC CAGATATTCCAGCT GCAT ACC 



2113 



2172 



2386 AAC AT CAC C AAG GACACAAGGTTTGCTGAGCT GCTGGCT CTGGAGAGT GAAGCGGGG 2442 

I I I I I III II II I I I 

ACTCTGGCAGAGACACCTGCTGGCTCCCTGGACACTCTCTGCTCTGCCCCTGGCAGCACT 2232 



2173 



2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I 
2233 GT CACCACC C AGCT GGGAC CTT AT GCCTT CAAGAT CCCACT GT CCATCC GCC AGAAGAT A 

2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 

MINIM I I II II I I I I I I I I I II I I I I I I I I I I 

2293 T GCAAC AGC CT AGAT GC CCC CAACT CACGGGGCAATGACT GGC GGATGT T AGCACAGAAG 



2502 



2292 



2562 



2352 



2622 



2563 CT CCACCT GGACAGCCATCT CAGCTTCTTT GCCT CCAAGCC CAGCC CCAC AGC CAT GAT C 

III I I I I I I I I I I I I I I I I I I I I I I I MINIM I Mill 

2353 CT CT CT AT GGACC GGT AC CT GAATT ACTTT GCCACCAAAGC GAGCC CCACGGGTGT GAT C 2412 

2623 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2682 

II I M I I II II I I I I I I I I II I I I I M I I I II I II 

2413 CT GGAC CT CT GGGAAGCT CT GCAGCAGGACGAT GGGGAC CT CAACAGCCT G GC GAGT GCC 2472 

2683 GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

III I I I I M I I II I I I I I I II I II I II 

2473 TT GGAGGAGAT GGGCAAGAGT GAGATGCT GGT GGCT GT GGC CAC C GAC GGG GACT GCT GA 2532 



Search completed: March 6, 2005, 10:10:18 
Job time : 8663.89 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



Searched: 



March 5, 2005, 15:11:26 ; Search time 11689.8 Seconds 

(without alignments) 
11407.261 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

I D ENT I T Y_NU C 

Gapop 10.0 , Gapext 1.0 



4708233 seqs, 24227607955 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



9416466 



Database 



GenEmbl : 



1 




gb ba : * 


2 




gb htg:* 


3 




gb in:* 


4 




gb_om: * 


5 




gb_ov: * 


6 




gb^pat : * 
gb_j?h : * 


7 




8 




gb_pl : * 


9 




gb_pr : * 


10: 


gb_ro : * 


11: 


gb_sts : * 


12: 


gb_sy: * 


13: 


gb_un : * 


14: 


gb_vi : * 
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AX449572 
Sequence 1 
AX449572 
AX449572.1 



2752 bp 
from Patent WO0210216. 

GI:21698195 



DNA 



linear PAT 03-JUL-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 



Craniata; Vertebra ta; Euteleostomi ; 



i REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 

Padigaru,M. , Mezes,P., Mishra,V., Burgess,C., Casman,S., 

Grosse,W.M., Alsobrook, J. P . , Lepley,D.M., Gerlach, V. L. , 

Macdougall , J . R . and Smithson,G. 

Proteins and nucleic acids encoding same 

Patent: WO 0210216-A 1 07-FEB-2002; 

Curagen Corporation (US) 

Location/Qualifiers 

l; .2752 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 100.0%; Score 2752; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 

Db 



CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I I I I I I I 1 I I I 
CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

121 CAGCAGAGT GCCACCGT GGC CAACC CAGTGC CT GGT GCCAAC C C GGAC CT GCTT C CCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CAGCAGAGT GCCACCGT GGC CAAC C CAGT GC CT GGT GCCAAC C C GGAC CT GCTT C CCCAC 180 

181 T T CCT GGT GGAGC CC GAGGAT GT GT ACAT CGT CAAGAACAAGC CAGT GCT GCT T GT GT GC 24 0 

I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 TT CCT GGT GGAGC CC GAGGAT GT GT ACAT CGT CAAGAACAAGC CAGT GCT GCT T GTGT GC 240 

241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

301 GACCAC GT GAT C GAGC GCAGC ACAGACGGGAGCAGT GGGCTGC C CACCAT GGAGGTC CGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GAC CAC GT GATC GAGC GCAGC AC AGACGGGAGCAGT GGGCTGC C CACCAT GGAGGT C C GC 360 

361 ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCTGGAGGAATACT GGT GC CAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATTAAT GTCT CAAGGCAGCAGGT CGAGAAGGTGTT CGGGCTGGAGGAATACT GGT GCCAG 420 

421 T GCGT GGCAT GGAGCT C CT CGGGCACCACCAAGAGT CAGAAGGCCT ACAT C C GCAT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 T GCGT GGCAT GGAGCT CCT CGGGCACC AC CAAGAGTCAGAAGGCCTACATCCGC AT AGCC 480 

481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

601 AACGAGGACCTGGT GGACCCGTC CCT GGAC CCCAAT GT AT ACAT CAC GC GGGAGCAC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I ! I I I I I I I I 

601 AACGAGGACCTGGTGGAC CCGT CC CT GGACCC CAAT GT AT ACAT CAC GC GGGAGCACAGC 660 

661 CT GGT GGT GCGACAGGCC C GC CTT GCT GACAC GGC CAACT ACAC CT GCGT GGC CAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

841 AGC C GGAGCT GCACCAACCC GGC GCCT CT CAAC GGGGGC GCTTT CTGT GAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 AGC CGGAGCTGCACCAACCCGGC GCCT CTCAAC GGGGGC GCTTT CTGTGAGGGGCAGT^AT 900 

901 GTC CAGAAAACAGC CT GCGC CAC C CT GT GCCCAGT AGAC GGCAGCT GGAGCC C GT GGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

1021 GCAC CCCGCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACAC CCGCAACT GT AC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 GCACCCCGCAACGGAGGGGAGGAGTGC CAGGGCACT GACCT GGACAC CCGCAACTGT AC C 1080 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AGT GACCTCT GT GTACACAGT GCT T CT GGCCCT GAGGACGT GGC C CT CTAT GT GGGCCT C 114 0 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

II I II IN II I III I I I I I III I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

1201 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACTC GTCCATT CT CAC CTCAGGCTT CCAG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1201 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACTC GTCCATT CT CACCT CAGGCTT CCAG 1260 

1261 CCC GT CAGC AT CAAGCC CAGCAAAGCAGACAACCC C CAT CT GCT CAC CAT CCAGC C GGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 CCCGT C AGCAT CAAGCC CAGCAAAGCAGACAAC CC C CAT CT GCT CAC CAT CCAGC C GGAC 1320 

1321 CT CAGCAC CAC CAC CAC CACCT AC CAGGGC AGT CT CT GT CCCCGGCAGGAT GGGCCC AGC 1380 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 



Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I i I I I I I 

Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTC GGGGGC CGGCT GATGAT C C CTAAT ACAGGT AT CAGC CT CCT CAT CCC CCCAGAT GC C 1620 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1561 CT CGGGGGC C GGCTGAT GAT CC CTAAT ACAGGT AT CAGC CT CCT CAT CCC CC CAGAT GCC 1620 

Qy 1621 ATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCTGCACAAGCCGGAAGACGTGAGG 1680 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 ATACCCCGAGGGAAGATCTAT GAGATCTACCTCACGCTGCACAAGCCGGAAGACGT GAGG 1680 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 

Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 

Db 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 AT C C GGGTCT ACT GCCT GCAT GACACC C ACGAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 ATC C GGGTCT ACT GCCTGC AT GAC ACC C ACGAT GCACT CAAGGAGGTGGT GCAGCT GGAG 2100 

Qy 2101 AAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGTCCTGCACTT CAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

Qy 2161 CACAACCTGCGCCTAT C CAT C CACGAT GT GC C C AG CT CC CT GTGGAAGAGT AAGCT C CTT 2220 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

Qy 2221 GT CAGCT ACC AGGAGAT CCC CTTT T AT C AC AT CT GGAAT GGC AC GCAGCGGT ACTT GCAC 2280 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 GTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGT ACTT GCAC 2280 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



2281 T GCACCT T CAC C CTGGAGCGT GT CAGCCC CAGCACT AGT GACCT GGCCT GCAAGCT GTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I 
2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

2341 GT GT GGCAGGT GGAGGGCGAC GGGCAGAGCT T C AGC AT CAACT T CAAC AT CAC CAAGGAC 24 00 

I I I I I I I I I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GT GT GGCAGGT GGAGGGCGACGGGC AGAGCTT CAGCAT CAACTT CAACAT CAC CAAGGAC 2400 

24 01 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 



2461 



2520 



C C C AGT GC CTT C AAGAT CC CCTT C CTCAT T C GGC AGAAGATAAT TT C C AGC CT GGACC CA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I LI I 
2461 CCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTGGACCCA 2520 

2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 



2581 



CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CT CAGCTT CTT T GC CT C CAAGCC CAGC C C CAC AGC C ATGAT CCT CAAC CT GT GGGAGGCG 2640 

2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

2701 C CAGAC GCT GGC CTCTT CACAGT GTCGGAGGCT GAGT GCT GAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 



RESULT 2 
AX451652 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



AX451652 
Sequence 
AX451652 
AX451652. 



2697 bp 
1 from Patent WO0233080. 

1 GI:21698587 



DNA 



linear PAT 03-JUL-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Koehler, R.H. 

Regulation of human netrin binding membrane receptor unc5h-l 
Patent: WO 0233080-A 1 25-APR-2002; 
Bayer Aktiengesellschaf t (DE) 

Location/Qualifiers 

1. .2697 

/organism="Homo sapiens" 
/ mol_type=" una s signed DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 



97.7%; Score 2687.4; DB 6; Length 2697; 



Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2691; Conservative 0; Mismatches . 6; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAcfcG 165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

Qy 166 GAC CT GCT T C CCCACTT CCT GGT GGAGCCCGAGGAT GT GT AC AT CGT CAAGAACAAGcfc A 225 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT TC CC CACTT C CT GGT GGAGC CC GAGGAT GT GT AC AT C GT CAAGAACAAGC CA 180 

Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

Qy 286 T GGGT GC GCCAGGT GGAC CAC GT GAT C GAGCGCAGCAC AGACGGGAGCAGT GGGCT GC C C 345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 T GGGT GC GCCAGGT GGAC CAC GT GAT C GAGCGCAGCAC AGACGGGAGCAGT GGGCT GC C C 300 

Qy 346 AC CAT GGAGGT CC GCATTAAT GT CT CAAGGCAGCAG GT CGAGAAGGT GTT C GGGCT GGAG 405 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AC CAT GGAGGT C C GCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAG 360 

Qy 406 GAAT ACT GGT GC CAGTGC GT GGCAT GGAGCT CCT C GGGCACCAC CAAGAGT CAGAAGGCC 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 361 GAAT ACT GGT GC CAGT GCGT GGCAT GGAGCTCCT CGGGCAC CAC CAAGAGT CAGAAGGC C 420 

Qy 466 T ACAT CCGC ATAGCC AGATT GCGCAAGAACTT CGAGC AGGAGC C GCT GGC CAAGGAGGT G 525 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 T AC AT CCGC AT AGCCTATTT GCGCAAGAACTT CGAGC AGGAGC C GCT GGC CAAGGAGGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

Qy 586 GT GGAGT GGCT C CGGAACGAGGACCT GGTGGACC CGT CCCT GGAC CCCAAT GT AT AC AT C 645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GT GGAGT GGCT C C GGAAC GAGGACCTGGTGGAC CCGT CCCT GGAC C C CAAT GT AT AC AT C 600 

Qy 646 ACGCGGGAGCACAGC CT GGT GGT GC GACAGGCC CGC CTTGCTGAC AC GGC CAACT AC AC C 705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 84 0 

886 T GT GAGGGGC AGAAT GT CCAGAAAACAGCCT GC GC CAC CCT GT GCC C AGT AGAC GGCAGC 945 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
841 TGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTGGACGGCAGC 900 

946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 960 

1006 GAGT GCT CTGAC C CAGC ACC C C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGT GCT CTGACC CAGC ACC C C GCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CT GGAC 1020 



961 



1125 



1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1021 AC C C GCAACT GT ACCAGT GAC CT CT GT GTAC ACACT GCTT CTGGCC CT GAGGAC GT GGCC 1080 

1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1200 

124 6 AC CT CAGGCTT CCAGCCCGTCAGC AT CAAGC CCAGC AAAGCAGACAACC C C CAT CT GCT C 1305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 AC CT CAGGCTT CCAGCCCGTCAGC AT CAAGC CCAGCAAAGCAGACAACC C C CAT CT GCT C 1260 

1306 AC CAT CCAGCCGGACCT CAGCACC AC CACCACCACCT AC CAGGGCAGT CT CT GT CC CC GG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1261 AC CAT CCAGCC GGACCT CAGCAC CAC CACCACCACCT AC CAGGGCAGT CT CT GT CC C C GG 1320 

1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 14 85 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1381 GGC GGCC GCCACACACT GCAC CACAGCT CT CCCACCT CT GAGGCCGAGGAGTT C GT CT C C 1440 

1486 CGC CT CT C CAC CCAGAACTACTT C CGCT CCCTGCCC C GAGGC AC CAGCAACAT GAC CT AT 1545 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

154 6 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCT GAT GAT CCCTAATACAGGAAT CAGC CTCCTC 1560 

1606 AT CC C CC CAGAT GC C AT ACCCCGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GC ACAAG 1665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 ATCCCCCCAGATGCCATACCCCGAGGGAAGATCTAT GAGAT CTACCTCACGCTGCACAAG 1620 



1666 



1725 



CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CC GGAAGACGT GAGGTT GCC C CT AGCT GGCT GT CAGAC CCT GCT GAGT C C CAT CGTT AGC 1680 



Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GAGGAT GT GCT GCAC CT GGGCGAGGAGGCGCC CT C C C AC CT CT ACT ACT GC CAGCT GGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I 
Db 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

Qy 2026 T C C CT C GAGT ACAACAT CCGGGT CTACT GCCT GC AT GACAC CC ACGAT GC ACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1981 T C C CTC GAGT ACAACAT CCGGGT CTACT GCCT GCAT GACAC CCAC GAT GCACT CAAGGAG 2040 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGTCCT GCAC 2145 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2041 GT GGTGCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCCACGGGT CCT GCAC 2100 

Qy 2146 TT CAAGGACAGTTAC CACAAC CT GCGC CTAT C CAT C CAC GAT GT GC CCAGCT C CCT GT GG 2205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TT CAAGGACAGTTAC C ACAACCT GCGC CTAT C CAT CCAC GAT GT GCCC AGCT C CCT GT GG 2160 

Qy 2206 AAGAGTAAGCTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACG 2265 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AAGAGTAAGCT CCTTGT CAGCTAC CAGGAGAT C C CCTTTT AT CACATCT GGAATGGCAC G 2220 

Qy 2266 CAGCGGTACTT GCACT GCACCT T CACC CT GGAGC GT GT C AGCCC C AGCACT AGT GACCT G 2325 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

Qy 2386 AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT C 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2460 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I I I I II II II I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I 
Db 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 



Qy 2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2697 
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ORIGIN 



AX527916 
Sequence 1 
AX527916 
AX527916.1 



2881 bp 
from Patent WO0229038. 

GI:25172359 



DNA 



linear PAT 21-NOV-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Herrmann, J. L. , Rastelli,L. and Shimkets , R. A. 

Novel proteins and nucleic acids encoding same and antibodies 
directed against these proteins 
Patent: WO 0229038-A 1 ll-APR-2002; 
Curagen Corporation (US) 

Location/Qualifiers 

1. .2881 

/organism="Homo sapiens" 
/mol_type= ,f unassigned DNA" 
/db xref="taxon:9606" 



Query Match 97.3%; 
Best Local Similarity 98.9%; 
Matches 2728; Conservative 



Score 2676.4; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2881; 



21; Indels 



9; Gaps 



3; 



Qy 

Db 



42 



CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 



Qy 

Db 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I 
102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 



Qy 



Db 



121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 



Qy 

Db 



181 
222 



TT CCT GGT GGAGC CC GAGGATGT GT ACAT C GT CAAGAACAAGCC AGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TT CCT GGT GGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGT GCT GCTT GTGTGC 281 



241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I ! I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 

282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

301 GACCACGT GATC GAGC GCAGCACAGACGGGAGCAGT GGGCTGC CC ACCATG GAGGT CC GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

342 GACCACGT GAT CGAGCGCAGCACAGACGGGAGCAGT GGTGAGCCGACCATGGAGGT CCGC 4 01 

361 ATTAAT GT CTCAAGGCAGCAGGT C GAGAAGGTGT T C GGGCTGGAGGAAT ACT GGT GCC AG 420 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

402 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 461 

421 T GC GT GGCATGGAGCTC CT CGGGCAC C AC CAAGAGT CAGAAGGCCT AC AT C C GCAT AGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

462 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 521 

4 81 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 64 1 

601 AAC GAGGAC CT GGT GGAC CC GT C CCT GGACC C CAAT GT AT AC AT C ACGCGGGAGC ACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

642 AAC GAGGAC CTGGT GGAC C C GT C CCT GGAC CCCAAT GT AT ACAT C ACGCGGGAGCACAGC 701 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

901 GTCCAGAA AACAGC CTGCGC C ACC CT GT GCC CAGTAGAC GGC AGCT GGAGC CCGT GG 957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1002 AGCAAGTGGTC GGC CTGT GGGCT GGACT GC ACC CACT GGC GGAGC CGT GAGT GCT CT GAC 1061 

1018 CCAGCACC C CGCAAC GGAGGGGAGGAGT GCCAG G GC ACT GACCTG GACAC C C GCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I I I I 

1062 CCAGCACC C CGCAACGGAGGGGAGGAGT GC CAGGGC ACT GAC CTGGACACC C GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



M I I 1 1 I I I I 1 1 I I I I I I 1 1 I I I I I I I I I 1 1 1 1 I I I 1 1 I I I I I I I I I I I 1 1 I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 
1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

1258 CAGCC CGT CAGCAT CAAGCCCAGCAAAGCAGACAAC CC C CAT CTGCTC ACCAT CCAGC C G 1317 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1302 CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAAC CCCCATCTGCTCACCATCCAGCCG 1361 

1318 GAC CT C AGCAC CAC C AC CAC C AC CT AC C AGGGCAGT CT CT GT CCC C GGCAGGAT GGGC CC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GACCTCAG CAC CAC CAC CAC CT AC C AGGGCAGT CT CT GT CCCC GGC AG GAT GGGC CC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1479 ACACT GCACCACAGCT CT CCCACCT CT GAGGCCGAG GAGTT CGT CT CCCGC CT CT CCACC 1538 

1498 CAGAACT ACTTC CGCT CC CT GC CCCGAGGCACCAGCAACATGACCTAT GGGACCTT CAAC 1557 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACT ACTT C C GCT CC CT GC C C CGAGGCACCAGCAACATGACCT AT GGGACCT T CAAC 1598 

1558 TT C CT C GGGGGC C GGCT GAT GAT C CCTAAT ACAGGT AT C AGCCTC CT C AT C C C C C CAGAT 1617 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 



1599 



1658 



1618 GCCAT ACCCCGAGGGAAGAT CT AT GAGATCT AC CT CACGCT GCACAAGCC GGAAGAC GT G 1677 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GC CAT ACCC CGAGGGAAGAT CT AT GAGATCT AC CT CACGCT GCACAAGC C GGAAGACGT G 



1659 



1718 



1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCT GGAGC CT GC GC CT CAAAAAGCAGT CGT GC GAGGGCAGCT GGG AGGATGTG 1854 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1839 GACAGCT GGAGCCT GCGC CT CAAAAAGCAGT CGT GC GAGGGCAGCT GGGAGCAGGAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

Qy 1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2035 T ACAACAT CC GGGT CT ACT GCCT GC AT GACACC CAC GAT GC ACTCAAGGAGGT GGT GC AG 2094 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2079 T ACAACAT CCGGGT CT ACT GCCTGC AT GACACC CAC GAT GCACTCAAGGAGGT GGT GC AG 2138 

Qy 2095 CT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CACGGGTCCT GCACT T CAAGGAC 2154 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2139 CT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CACGGGTCCT GCACTT CAAGGAC 2198 

Qy 2155 AGTT ACCACAACCT GCGCCT AT CCAT CC AC GAT GT GC CCAGCT CC CT GT GGAAGAGT AAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2199 AGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGT GGAAGAGT AAG 2258 

Qy 2215 CT C CTT GT CAGCT ACCAGGAGAT C CCCTTTT AT CACATCT GGAAT GGC ACGCAGCGGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
Db 2259 CT CCTT GT CAGCT AC CAGGAGATC CCCTTTT AT CAC ATCT GGAAT GGC ACGCAGCGGT AC 2318 

Qy 2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I 
Db 2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 2379 CT GTGGGT GT GGCAGGT GGAGGGCGAC GGGCAGAGCTT C AGCATCAACTT CAACAT CAC C 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GT GGGC CCC AGT GCCTT CAAGAT CC C CTT C CTCATT C GGCAGAAGATAAT T T CCAGC CT G 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGC CAT CT CAGCTT CTTT GCCT C CAAGCCCAGC C CC ACAGCCATGAT CCT CAACCT GT GG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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CQ730306 ' 2784 bp DNA linear PAT 03-FEB-2004 

Sequence 16240 from Patent WO02068579. 

CQ730306 

CQ730306.1 GI: 42303801 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Venter, C. J. , Adams, M.C., Li,P.W. and Myers, E.W. 

Kits, such as nucleic acid arrays, comprising a majority of 

humanexons or transcripts, for detecting expression and other uses 

thereof 

Patent: WO 02068579-A 16240 06-SEP-2002; 
PE Corporation (NY) (US) 

Location/Qualif iers 

1. .2784 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 88.5%; 
Best Local Similarity 93.5%; 
Matches 2646; Conservative 



Score 2435.4; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2784; 

6; Indels 177; Gaps 



3; 



Qy 

Db 



4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 120 

166 GAC CT GCT T C C CCACTT CCT GGT GGAGC C C GAGGAT GT GTACAT CGT CAAGAACAAGCC A 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GACCTGCTT C CCCACTT CCTGGT GGAGCCC GAGGAT GT GTACAT CGT CAAGAACAAGCCA 180 

226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 240 

286 TGGGT GC GCCAGGT GGACC ACGT GATCGAGC GCAGCACAGAC GGGAGCAGTGGGCT GCC C 345 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TGGGT GC GCCAGGT GGACCACGT GATCGAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC C 300 

346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 ACCATGGAGGT CCGC AT TAAT GT CT CAAGGC AGCAGGT CGAGAAGGT GT T C GGGCT GGAG 360 

406 GAATACT GGT GC CAGT GC GT GGCAT GGAGCT C CT C GGGCAC CAC CAAGAGT C AGAAGGC C 465 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
361 GAATACT GGT GCCAGT GC GT GGCAT GGAGCT C CT C GGGCAC CAC CAAGAGT CAGAAGGC C 420 



Qy 



466 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 
II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



421 TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 480 



Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCGCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 540 

Qy 586 GT GGAGT GGCT C CGGAAC GAGGAC CT GGT GGAC C C GTC CCT GGACC C CAAT GT AT AC AT C 645 

I II I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 541 GT GGAGT GGCT CC GGAAC GAGGACCT GGT GGACC CGT CCCT GGAC CC CAAT GTAT ACAT C 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ACGC GGGAGCACAGCCT GGT GGT GC GACAGGCC C GC CT T GCT GACAC GGCCAACT ACAC C 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 661 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 720 

Qy 766 - 765 

Db 721 GGTGGGCCCCGGGACTCCCTGGTCACAGGGAGAGGCACTGCGGTGCCCCTGGGCAGTGAC 780 

Qy 766 GT GAACGGT GGGT GGTC GAC GT GGACCGAGT GG 798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 ATGTGGCTGTCCTTCTCTGTCCGGCCAGTGAACGGTGGGTGGTCGACGTGGACCGAGTGG 840 

Qy 799 TCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAAC 858 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAAC 900 

Qy 859 CCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGC 918 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGC 960 

Qy 919 GC CACCCT GT GC C CAGTAGACGGC AGCT GGAGC C C GT GGAGCAAGT GGT C GGC CT GT GGG 978 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GC CACCCT GTGC C CAGT GGACGGCAGCT GGAGC C CGT GGAGCAAGT GGT C GGCCT GT GGG 1020 

Qy 979 CTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGG 1038 

I I I I I I III I I I I I III I I III II I I I I I I I I I I I I I II I III III II III II Mill II 

Db 1021 CT GGACT GCACC CACT GGC GGAGCCGTGAGT GCT CT GAC C CAGCAC C CCGCAAC GGAGGG 1080 

Qy 1039 GAGGAGT GC CAGGGCACT GACCT GGACAC C CGCAACT GT AC CAGT GAC CT CT GT GT ACAC 1098 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GAGGAGTGCCAGGGCACT GACCTGGACACCCGCAACTGTACCAGTGACCT CT GTGTACAC 1140 

Qy 1099 A GTGCTTCTGGCCCT 1113 

I I I I I I I I I II I I I 

Db 1141 AACTCCTACACCCCTGCCCCCACCAAGGCCAT GCT GTCTCCCGC AGCT GCTTCTGGCCCT 1200 

Qy 1114 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1173 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAGGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTG 1260 

Qy 1174 CTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCT GGACT CAGATGTGGCT GAC 1233 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 CT TGT CCT CAT CCTCGTTTATTGCCGGAAGAAGGAGGGGCT GGACT CAGATGTGGCT GAC 1320 



Qy 1234 T C GT CCATT CTCACCT CAGGCT T C C AGC C C GT C AGC AT CAAGCC C AGCAAAGCAGACAAC 1293 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

Db 1321 TCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAAC 1380 

Qy 1294 CCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGT 1353 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGT 1440 

Qy 1354 CTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTC 1413 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CTCTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTC 1500 

Qy 1414 AGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAG 1473 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I 

Db 1501 AGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAG 1560 

Qy 1474 GAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGC 1533 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GAGTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGC 1620 

Qy 1534 AACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGT 1593 

I I I I I I I II I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGA 1680 

Qy 1594 ATCAGCCTCCTCATC C C C CC AGAT GCCAT AC CC C GAGGGAAGAT CT AT GAGAT CTAC CT C 1653 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ATCAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTC 1740 

Qy 1654 ACGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGT 1713 

I I I I I I I I I I II I I I I I I I I I I I I 

Db 1741 ACGCTGCACAAGCCGGAAGACGTG 1764 

Qy 1714 CCCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATG 1773 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1765 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATG 1815 

Qy 1774 GACCACT GT GGGGAGCCCAGCC CT GAC AGCT GGAGC CT GCGCCT CAAAAAGC AGT CGT GC 1833 

I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1816 GACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGC 1875 

Qy 1834 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1893 

I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1876 GAGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTAC 1935 

Qy 1894 TGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTG 1953 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1936 TGCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTG 1995 

Qy 1954 GTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCG 2013 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1996 GTGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCG 2055 

Qy 2014 GT GGCCT GCAC CT C C CT C GAGTACAACAT CCGGGT CT ACTGCCT GCAT GAC AC C C AC GAT 2073 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2056 GTGGCCT GCACCT CCCT CGAGT ACAAC AT CC GGGT CT ACTGC CT GCAT GACAC C C AC GAT 2115 



Qy 2074 GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT G GGGGGACAGCT GAT C CAGGAGCC A 2133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2116 GCACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CA 2175 

Qy 2134 CGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCC 2193 

I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2176 CGGGTCCTGCACTTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCC 2235 

Qy 2194 AGCT C C CT GT GGAAGAGTAAGCT C CTT GT C AGCT AC CAGGAGAT C CC CTTT T AT C ACATC 2253 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2236 AGCT C C CT GT GGAAGAGTAAGCT C CTTGT C AGCT AC CAGGAGAT CCC CTT T TAT C AC ATC 2295 

Qy 2254 TGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGC 2313 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2296 TGGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGC 2355 

Qy 2314 ACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTC 2373 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2356 ACTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTC 2415 

Qy 2374 AGCATCAACTTCAACATCACCAAGGACACAAGGTTTGCT GAGCTGCTGGCT CT GGAGAGT 2433 

I I I I I I I I I I I I I I I I I I- 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2416 AGCATCAACTTCAACATCACCAAGGACACAAGGTTT GCT GAGCTGCTGGCT CT GGAGAGT 2475 

Qy 2434 GAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGG 2493 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2476 GAAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGG 2535 

Qy 2494 CAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTG 2553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2536 CAGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTG 2595 

Qy 2554 GCCCAGAAACTCCACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACA 2613 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 
Db 2596 GC C CAGAAACT CCAC CT GGACAGC C AT CT CAGCTT CTTT GC CT C CAAGC C CAGC C C CACA 2655 

Qy 2614 GCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTG 2673 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2656 GCCATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTG 2715 

Qy 2674 GCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCT 2733 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2716 GCTGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCT 2775 

Qy 2734 GAGTGCTGA 2742 

I I I I I I I I I 
Db 2776 GAGTGCTGA 2784 
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Query Match 85.6%; Score 2356; DB 6; Length 3580; 

Best Local Similarity 93.6%; Pred. No. 0; 

Matches 2537; Conservative 0; Mismatches 5; Indels 168; Gaps 1; 

Qy 43 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 102 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCCATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGG 60 

Qy 103 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCCGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAAC 120 

Qy 163 C CGGACCT GCT TC CC CACTTC CT GGT GGAGCCCGAGGATGT GT AC AT C GT CAAGAACAAG 222 

I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 121 CCGGACCTGCTT CCCCACTT CCT GGTGGAGCCCGAGGATGTGTACAT CGT CAAGAACAAG 180 

Qy 223 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 282 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I t I I I I I I I I II I I I I I I I I I I I I I I I II I 
Db 181 CCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGG 24 0 

Qy 283 GAGT GGGT GCGC CAGGT GGACCAC GTGATC GAGC GCAGCACAGACGGGAGC AGT GGGCTG 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAGT GGGT GCGCCAGGT GGAC CACGT GATC GAGC GCAGCAC AGACGGGAGCAGT GGGCTG 300 

Qy 343 CCCACCATGGAGGT C CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT CGGGCT G 402 

I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 301 C CCACCAT GGAGGT C CGCATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT G 360 

Qy 403 GAGGAAT ACTGGTGCCAGTGCGT GGCATGGAGCT CCTCGGGCACCACCAAGAGT CAGAAG 462 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 
Db 361 GAGGAAT ACT GGT GCCAGT GCGT GGCAT GGAGCT CCT CGGGCAC C AC CAAGAGT CAGAAG 420 

Qy 463 GCCT ACAT CCGCAT AGCCAGATT GC GCAAGAACTT C GAGC AGGAGC C GCT GGC CAAGGAG 522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 111 I I I I I I I I I I I I I I I I I I III I I I 
Db 421 GCCTACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAG 480 



Qy 



523 



GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 



582 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 GTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCC 540 



Qy 583 GAGGTGGAGT GGCT CCGGAAC GAGGAC CTGGT GGACC C GT C CCT GGAC CCCAAT GTAT AC 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GAGGT GGAGT GGCT CCGGAAC GAGGAC CTGGT GGAC C C GT C CCT GGAC CC CAAT GTAT AC 600 

Qy 643 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 ATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTAC 660 

Qy 703 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 762 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ACCTGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTC 720 

Qy 763 TACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGG 822 

I I I I I I 

Db 721 TACGTG 726 

Qy 823 CGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCT 882 

Db 727 ; 726 

Qy 883 T T CT GT GAGGGGC AGAAT GT C CAGAAAACAGCCT GC GCCACCCT GT GC C CAGT AGAC GGC 942 

I I I I I I 

Db 727 GACGGC 732 

Qy 943 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 1002 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 733 AGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGC 792 

Qy 1003 C GT GAGT GCT CT GAC CC AGCAC C CCGCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CT G 1062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 793 C GT GAGT GCT CTGAC C CAGC AC C C CGCAACGGAGGGGAGGAGT GC C AGGGCACT GAC CT G .852 

Qy 1063 GACACCC GCAACT GT AC CAGT GAC CT CT GT GT ACACAGTGCTT CT GGCCCT GAGGAC GT G 1122 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 853 GACACCCGCAACT GTACCAGTGACCTCTGTGTACACACTGCTT CT GGCCCTGAGGACGT G 912 

Qy 1123 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 913 GCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTC 972 

Qy 1183 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1242 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 973 ATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATT 1032 

Qy 1243 CTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTG 1302 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1033 CT CACCT CAGGCT T C CAGCCC GT CAGC ATCAAGC C C AGCAAAGCAGACAAC CC CCAT CT G 1092 

Qy 1303 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1093 CTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCC 1152 

Qy 1363 CGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTG 1422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1153 C GGCAGGAT GGGCC C AGC CC CAAGT T C C AGCT CACCAATGGGC ACCT GCT CAGC CC C CT G 1212 

1423 GGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTC 1482 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1213 GGT GGCGGCC GCC AC ACACT GCACC ACAGCT CT CCC ACCT CTGAGGC C GAGGAGTT C GT C 1272 

1483 TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCT^CATGACC 1542 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
TCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACC 1332 



1273 



1543 



1333 



TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTC 1602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 
TATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTC 1392 



1603 CT CAT CCCC C C AGAT GC CAT AC C CC GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCAC 

I II I I II I I I I I II I I I I I I I I I I I I I I I II I I I II II I I I I II I I II I I I I I I I I I I I I 
CT CAT CC CC C CAGAT GC CAT AC CCC GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT G CAC 



1393 



1663 



1453 



AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTT 



1662 



1452 



1722 



1512 



1723 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1782 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1513 AGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGT 1572 

1783 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1842 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1573 GGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGC 1632 

1843 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1633 TGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTG 1692 

1903 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1693 GAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAG 1752 

1963 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 2022 

I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I H I I I I I I I I I I I I I I I I I I 

1753 GCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGC 1812 



2023 



2082 



ACCT C CCT CGAGT ACAACATCC GGGT CT ACT GCCT GCATGACAC CCACGAT GCACT CAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 
1813 ACCT C CCT CGAGT ACAACAT C C GGGT CT ACT GCCT GC ATGACAC CC AC GAT GCACT CAAG 1872 

2083 GAGGT GGT GC AGCT GGAGAAGCAGCTGGGGGGAC AGCT GAT CCAGGAGCCACGGGT CCT G 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1873 GAGGT GGT GC AGCT GGAGAAGC AGCT GGGGGGAC AGCT GAT CCAGGAGC CACGGGT C CT G 1932 

2143 CACTT CAAGGACAGT T AC CACAACCT GC GCCT AT C CAT C CAC GAT GT GCCCAGCTCC CT G 2202 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
1933 CACT T CAAGGAC AGTTAC CACAAC CT GCGCCT AT C CAT C CAC GAT GT GCC CAGCTC C CT G 1992 

2203 T GGAAGAGTAAGCT CCTT GT C AGCT AC CAGGAGAT CC C CTTTT AT CACAT CT GGAAT GGC 2262 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
1993 T GGAAGAGTAAGCT C CTT GT CAGCT AC CAGGAGAT C CC CT TTT AT CACAT CT GGAAT GGC 2052 



Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db- 



2263 ACGC AGCGGT ACTTGCACT GC AC CT T C AC C CT GGAGCGT GT C AGC C C CAGCACT AGT GAC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2053 ACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGAC 2112 

2323 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
2113 CTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAAC 2172 

2383 T T CAAC ATCACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGG 2442 

I I It I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2173 T T CAACAT CACCAAGGAC ACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGG 2232 

2443 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2233 GTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATA 2292 

2503 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I 

2293 ATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAA 2352 

2563 CT CCAC CTGGACAGCCAT CT CAGCTT CT T T GCCT C CAAGCCCAGCCCCACAGC CAT GAT C 2622 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT CCAC CT GGAC AGC CAT CT CAGCTT CT TT GCCT C CAAGCCCAGC CC CACAGCCAT GAT C 2412 



2353 



2623 



2682 



CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 

I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2413 CTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCA 2472 



2683 



2473 



2743 



2533 



GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2532 



2752 



GGCCGGCCAG 
I I I I I I I I I I 
GGCCGGCCAG 2542 
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MMU487852 3992 bp mRNA linear ROD 24-SEP-2002 

Mus musculus mRNA for netrin receptor Unc5hl (Unc5hl gene) . 
AJ487852 

AJ487852.1 GI:22035783 

netrin receptor Unc5hl; Unc5hl gene. 

Mus musculus (house mouse) 

Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 
1 

Engelkamp, D. 

Cloning of three mouse Unc5 genes and their expression patterns at 
mid-gestation 

Mech- Dev. 118 (1-2), 191-197 (2002) 

22239710 

12351186 

2 (bases 1 to 3992) 



AUTHORS 

TITLE 

JOURNAL 

FEATURES 

source 



gene 



CDS 



Engelkamp, D. 
Direct Submission 

Submitted ( 15-MAY-2002 ) Neuroanatomy, Max Planck Institute for 
Brain Research, Deutschordenstrasse 46, Frankfurt 60528, GERMANY 

Location/Qualifiers 

1. .3992 

/organism="Mus musculus" 
/mol_type="mRNA" 
/db_xref="taxon: 10090" 
1. .3992 
/gene="Unc5hl M 
232. .2928 
/gene="Unc5hl" 
/codon_start=l 

/product="netrin receptor Unc5hl" 
/protein_id="CAD32250 . 1" 
/db_xref ="GI : 22035784" 
/db_xref="GOA:Q8KlS4" 
/db_xref="UniProt/TrEMBL:Q8KlS4" 

/ trans lation="MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYIVKNKPVLLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDGSSGLPTM 
EVRINVSRQQVEKVFGLEEYWCQC^ 

SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLVVRQARLADTAN 
YTCVAKNIVARRRSASAAVIVYVNGGWSTWTEWSVCSASCGRGWQKRSRSCTNPAPLN 
GGAFCEGQNVQKTACATLCPVDGSWSPWSKWSACGLDCTHWRSRECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTSSGPEDVALYIGLVAVAVCLILLLLVLVLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMI PNTGI SLLIPPDAI PRGKI YEI YLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGV 
LLTRPVI LAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKEW 
QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERWASTSDLACKVWWQVEGDGQSFNINFNITKDTRFAEMLALESEG 
GVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPSPT 
AMILNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVSEAEC" 



ORIGIN 



Query Match 84.4%; 
Best Local Similarity 90.3%; 
Matches 2484; Conservative 



Score 2323.2; 
Pred. No. 0; 
0; Mismatches 



DB 10; Length 3992; 
268; Indels 0; Gaps 



0; 



Qy 

Db 



187 



CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 6 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCGCCCGCGGGGCCCCTAGTCCAGCCCGCTCGTCCGCCCGCGGCCATGGCCGTCCGGCCC 246 



Qy 

Db 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II II I I I I I I I I I 
247 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTTCGTGGTTCGGGTGCC 306 



Qy 

Db 

Qy 

Db 



121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 
307 CAGCAGAGT GC CACAGT GGC CAACCCAGT GCCTGGTGCCAACCC AGACCT GCT GCC CCAC 366 

181 TT CCT GGTGGAGCCCGAGGAT GT GTACATCGTCAAGAACAAGCCAGTGCT GCTTGTGT GC 240 

I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I 
367 TTCCTGGTAGAGCCGGAGGACGTGTACATTGTCAAGAACAAGCCCGTGCTGCTGGTGTGC 426 



241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

427 AAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAATGGGTTCGCCAGGTC 486 

301 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCCACCATGGAGGTCCGC 360 

II I I I I I I I I I I I I I I I I I I I I II I I I I II II MM M I M I I I I I I M I 

487 GAT CACGT CAT C GAAC GC AGC ACT GAC GGC AGC AGCGGATT GCCAACC AT GGAGGT C CGG 546 

361 ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT ACT GGT G CCAG 420 

II II II I I II II M II M I I I I I I II I I I I I I II I II I II II II I I II I II I I I 
547 AT CAACGTAT CAAGGCAGCAGGT C GAGAAAGT GT TT GGGCT GGAGGAGT ACT GGT GC CAG 606 

421 TGCGT GGCAT GGAGCT C CTC GGGC ACCAC CAAGAGT C AGAAGGC CTACAT C C GC AT AGC C 480 

II I II I I II M I I I II II I II II I M II I II I II I M II II II II I I I II III 
607 TGTGTGGCATGGAGCTCCTCAGGAACCACCAAAAGCCAGAAGGCCTACATCCGGATTGCC 666 

481 AGATT GC GCAAGAACT T C GAGCAGGAGC CGCT GGC CAAGGAGGT GT CCCT GGAGC AGGGC 540 

I II II II II I II M I M I II II I M II I II I II I II I II I II II II I I I I III 
667 T ATTTGC GCAAGAACTTT GAGCAGGAGC CGCT GGC CAAGGAAGT GT CACT GGAGCAAGGC 726 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

M Mill II II II II II II I II I I II I Mill M I II II II I I I I I I I I 
727 ATTGTGCTACCTTGTCGCCCCCCGGAAGGAATCCCCCCAGCTGAGGTGGAGTGGCTCCGA 786 

601 AACGAG GAC CT GGT GGACCC GTCCCTGGAC C CCAAT GT AT ACAT CACGCGGGAGC ACAG C 660 

II I I II I I I I II M I I II II II I II I I I M I I II I II II I M II M II I II I II 
787 AAT GAGGACCTC GT GGACCCCTCCCTC GACCCCAATGT GT ACAT CACACGGGAGCAC AGC 846 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

II II Mill I I II II II II I II II I II I M I I M I M I I I I M M I I I I I II I I 

847 CT AGT C GTGCGGC AGGCCCGC CT GGCC GACACTGC CAACT ACAC CT GC GT GGCCAAGAAC 906 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I II I II I I I II I M I I II I I II I II II II II I II II II II I I I II I M I M 

907 ATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTATGTGAACGGTGGGTGG 966 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

II I I I I I II I I I I I I II I I II II II I II I II I II II II I I I I I II II I II II I M I M 

967 TCGACGTGGACCGAGTGGTCCGTCTGCAGTGCCAGCTGTGGGCGTGGCTGGCAGAAACGG 1026 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

M I I I I M M II I II II II II M I I I II II II M I I I I II I II II I II I II II M I II 

1027 AGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTCTGTGAGGGGCAGAAT 1086 

901 GT CCAGAAAACAGCCT GCGC CAC CCTGT GC C C AGT AGAC GGC AGCT GGAGC C C GT GGAGC 960 

I I II I II I II I I I II II I II I I I II II I I M I I I II II M II II I I II I II II I 

1087 GT C CAGAAAACAGC CT GCGCCACT CT GT GC C C AGT GGAT GGGAGCT GGAGC C CAT GGAGT 1146 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

II I I II II Mill II II I I I I II II II I I II M M II I II I II II II I I II I I II 
1147 AAGTGGTCAGCCTGCGGGCTTGACTGCACCCACTGGCGGAGCCGGGAGTGCTCCGACCCA 1206 

1021 GCACC C C GCAACGGAGGGGAGGAGT GCCAGGGCACT GACCT GGACAC C C GCAACT GT ACC 1080 

I I Mill II HI I I II 41 I I I MM I III I I Ml II I I I I III II I I I II II II I 

1207 GCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCTGACCTGGACACCCGCAACTGTACC 1266 
1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 
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Db 

Qy 

Db 

Qy 

Db 

Qy 
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Qy 
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Qy 
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Qy 
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Qy 

Db 

Qy 



1267 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCTCTCTACATCGGCCTC 



1326 



1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I I 

1327 GTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTCCTCATCTACTGCCGC 138 6 

1201 AAGAAGGAGGGGCT GGACT C AGAT GT GGCT GACT C GT C CAT T CT C AC CT C AGGCT T C C AG 1260 

I I I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I 
1387 AAGAAGGAAGGACT GGACT CAGACGT GGCT GACT CAT C CAT C CTT AC CT C AGGCTT C CAG 1446 

1261 CCC GTCAGC AT CAAGC C CAGCAAAGC AGACAACC C C CAT CT GCT C AC CAT C CAGC C GGAC 1320 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1447 CCT GTCAGCAT CAAGC CCAGCAAAGCAGACAAT CC CCAT CT GCT C AC CAT C CAAC CGGAC 1506 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1507 CTCAGCACCAC CAC GAC C ACCT AC CAGGGC AGCCT GT GT CC C C GGCAGGAT GGACCC AGC 1566 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 14 4 0 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
1567 CCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGCAGTGGCCGCCATACG 1626 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1627 CTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCCCGCCTCTCCACCCAA 1686 

1501 AACT ACT TC CGCT CC CT GC C C CGAGGCACCAGCAACAT GACCTAT GG GAC CTT CAACTT C 1560 

I I I I I II I II II I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I II I II I II 

1687 AACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTATGGGACCTTCAACTTC 174 6 

1561 CTC GGGGGC CGGCTGAT GAT C C CTAAT ACAGGT AT CAGC CT CCT CAT C CC C CCAGAT GC C 1620 

II I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I II I I I I I I I I I I I II III 
1747 CTC GGGGGC CGGCTGAT GAT C C CTAAC AC AGGAAT CAGCCT C CT CAT AC C CCC GGACGC C 1806 

1621 ATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCT GCACAAGCCGGAAGACGT GAGG 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II 
1807 ATCCCCCGAGGAAAGATCTACGAGAT CTACCT CACT CTGCACAAGCCAGAAGACGTGAGG 1866 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
1867 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCTATCGTTAGCTGTGGGCCCCCAGGA 1926 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II II III 
1927 GTCCTGCTCACCCGGCCAGTCATCCTTGCCATGGACCACTGCGGGGAGCCCAGTCCCGAC 1986 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I 

1987 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCCTGTGAGGGCAGCTGGGAGGACGTGCTGCAC 2046 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

2047 CTTGGTGAGGAGTCGCCCTCTCATCTCTACTACTGCCAGCTGGAGGCCGGGGCCTGCTAT 2106 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 



2107 GTCTTCACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 2166 



Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 204 0 

I I I I I I I I I I I I III I I I I I I I I II I II I I I I I I I I II I I I I II I I I I I I I I I 
Db 2167 ACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACGTCCCTCGAGTACAAC 2226 

Qy 2041 ATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAGCTGGAG 2100 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 2227 ATCCGAGTGTACTGCCTGCACGACACCCACGATGCTCTCAAGGAGGTGGTGCAGCTGGAG 2286 

Qy 2101 AAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGACAGTTAC 2160 

I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I II I I I 
Db 2287 AAGC AGCT GGGTGGACAGCT GAT C CAGGAGCC CCGT GT C CT GC ACT TCAAAGACAGTT AC 2346 

Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I II II I I I I I I I I I II I I I Ml I I I I I I I I I I I I I II I I I I I I I I I II 
Db 2347 CACAACCT ACGT CT GT CCAT C CAC GAC GT GCC CAGCT C CCT GT GGAAGAGCAAGCT C CTT 2406 

Qy 2221 GT CAGCT AC CAGGAGAT C CCCT TT T AT CACAT CT GGAAT GGCAC GC AGC GGT ACTT GCAC 2280 

I I I I I I I I I I I I I I II I I I I Mill I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Db 2407 GTCAGCTACCAGGAGAT CCCTTTTT AC CACAT CT GGAAT GGCACTCAGCAGTATCTGCAC 2466 

Qy 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I 
Db 2467 TGCACCTTCACCCTGGAGCGCGTCAATGCCAGCACCAGCGACCTGGCCTGCAAGGTGTGG 2526 

Qy 2341 GTGTGGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACCAAGGAC 2400 

I I II I I I I I I I I I I I I I II II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2527 GT GT GGCAGGT GGAGGGAGAT GGACAGAGCTT CAACAT CAACTT TAAC AT CACTAAGGAC 2586 

Qy 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

II I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I 

Db 2587 ACGAGGTTTGCTGAAATGCTGGCTCTGGAGAGTGAAGGGGGGGTCCCAGCCCTGGTGGGC 264 6 

Qy 2461 CC C AGT GC CT T CAAGAT CCC CTT CCT CATT C GGCAGAAGATAATTT CCAGC CT GGACC C A 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2647 CCCAGT GCCTT CAAGAT CCC CTT CCTCATT C GGCAAAAGAT CAT T ACCAGC CT GGACCC A 2706 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2707 CCCTGCAGCCGGGGCGCCGACTGGCGAACTCTAGCCCAGAAACTTCACCTGGACAGCCAT 2766 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

II I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2767 CTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTCAACCTATGGGAGGCG 2826 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I ! I I I I 
Db 2827 CGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTGGCCGGACTGGGCCAG 2886 

Qy 2701 CCAGAC GCT GGCCT CTT CACAGT GT CGGAGGCTGAGT GCTGAGGC CGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2887 CC AGAT GCT GGCCT CTT CACCGT GT CAGAGGCC GAGT GCTGAGAC CAGC C AG 2938 
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Qy 

Db 



4 6 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 
I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

166 GAC CT GCTT CCCCACTTCCT GGT GGAGCCC GAGGAT GT GT ACAT CGT CAAGAACAAGC CA 225 

I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GAC CT GCTGCCC CACTTCCT GGT AGAGC CT GAGGACGT GTACATT GT CAAGAACAAGCC G 180 

226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

286 T GGGTGCGC C AGGTGGAC C AC GT GATC GAGCGCAGCAC AGAC GGGAGC AGT GGGCT GC C C 345 

I I I I I I I I I I I I I II I I I I I II II I I II I I I I III I I I II I II I I I I 
241 T GGGT CCGCCAGGT C GAT C AC GTAAT T GAAC GC AGCAC CGAC AGC AGC AGC GGAT T G CCA 300 



Qy 



34 6 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 4 05 
I I I I I I I I I I I I I I II II II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 



301 AC CAT GGAGGT C CGT AT CAAC GT AT C GAGGCAG CAGGT AGAGAAAGT GTTT GGGCT GGAG 360 

406 GAATACT GGT GC CAGTGC GT GGCAT GGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGCC 465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 GAATACT GGT GC CAGTGT GT GGCAT GGAGCT CCT CGGGT AC CAC CAAAAGT CAGAAGGC C 420 

466 T AC AT CCGC AT AGC CAGATTGC GCAAGAACTT C GAGC AGGAGC C GCT GGC CAAGGAGGT G 525 

I I I I I I I I II III I I I I I I I II I I I I I I I II I I II I II I I I I I I I I I I I III 

421 T AC AT CC GGATT GC CT AT TTGC GCAAGAACTTT GAGCAGGAGC CACT GGC CAAGGAAGT G 480 

526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I II I II I I I I I II II II II I I I I II II II I I I I I I I I I I III 

481 T CACT GGAGCAAGGCAT T GT ACT AC CTT GT C GC C C CCCAGAAGGAAT CCC C CCAGCT GAG 540 

586 GT GGAGT GGCT C C GGAACGAGGAC CT GGTGGAC CC GT CCCT GGAC C CCAAT GT AT AC AT C 645 

I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
541 GT GGAGT GGCTT CGAAAT GAGGACCT C GTGGACCC CT CCCT CGAT CCCAAT GT GTACAT C 600 

64 6 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

601 AC GCGGGAGC ACAGC CT AGT CGT GC GT CAGGCC CGCCT GGC CGACACGGC CAACT ACAC C 660 

706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

886 T GT GAGGGGCAGAAT GT CCAGAAAAC AGCCT GCGCCAC C CT GT GCCC AGT AGAC GGC AGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
841 T GTGAGGGGCAGAAT GT CCAGAAAAC AGCCT GCGCCACT CT GT GCCCAGT GGAT GG GAGC 900 

94 6 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

1006 GAGT GCT CTGAC CCAGCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 
961 GAGT GCT CTGACC C AGCACCCCGCAAT GGAGGT GAGGAGT GT C GGGGT GCT GAC CT GGAC 1020 

1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I I I II II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I III 
1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 



Qy 124 6 ACCT CAGGCTT C C AGC C C GTC AGC AT CAAGC CC AGCAAAGC AGACAAC CC C CAT CT GCT C 1305 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 

Qy 1306 ACCATC CAGC CGGACCT C AGCAC C AC C ACC AC CAC CT AC CAGGGCAGT CT CT GT C C CCGG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1261 ACCATC CAGC CAGACCT CAGCACC AC C ACTAC C AC CT AC C AGGGC AGT CT AT GTT C GAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGC GGCC GC CACACACT GC ACCAC AGCT CT C C C AC CTCT GAGGC C GAGGAGTT C GT CT C C 1485 

I I.I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 14 4 0 

Qy 1486 C GC CTCT CCACC CAGAACT ACTT C CGCTCCCTGCCC CGAGGCAC CAGCAACAT GACCT AT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 ATC CCCC CAGAT GC CAT AC CCCGAGGGAAGAT CT AT GAGAT CTACCT CACGCT GCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 ATACCCCCGGATGCCAT CCCCCGAGGAAAGATCT AC GAGAT CTACCTCACACTGCACAAG 162 0 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCAGAAGACGTGAGGT T GC CCCT AGCT GGCT GT CAGACCCT GCT GAGT CCAGT CGTTAGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1681 T GT GGGC CC CCAGGAGT C CT GCT CAC C C GGC CAGT CAT CCT T GCAAT GGACC ACT GT GGA 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GAGGATGTGCTGCACCTTGGTGAGGAGTCACCTTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I II I I I I I I I III I I I I I I I I I I I II I I II I I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 T CCCTC GAGT ACAACAT C CGGGT CTACT GCCT GCAT GACAC CC ACGAT GCACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II MINIMI 

Db 1981 T CC CTT GAGT ACAACAT CC GAGT GT ACT GC CT ACAC GACAC CCAC GACGCT CT CAAGGAG 2040 



Qy 

Db 



2086 
2041 



GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCAC 
I I I I I I I I I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
GT GGT GCAGCT GGAGAAGCAGCT AGGT GGACAGCT GAT CCAGGAGC CT CGC GT C CT GC AC 



2145 
2100 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2146 TT CAAGGACAGTT AC CACAAC CT GC GC CT AT CC AT C CACGATGT GC CCAGCT C CCT GT GG 2205 

I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGT T ACCACAACCTACGT CTCT C CAT C CAC GACGT GC CCAGCT C CCT GT GG 2160 



2206 



2161 



2266 



2221 



AAGAGTAAGCT C CT T GT C AGCT ACCAGGAGAT C CC CTTTT AT CACAT CT GGAAT GGCAC G 

I I I II I I I I I I I H I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I Mill 

AAGAGCAAGCT ACT T GT C AGCTACCAGGAGAT C C CTTTTTAC CACAT CT GGAACGGC AC C 



2265 



2220 



2325 



CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 

I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I II I I II I I 

C AGCAGT AT CT GCACT GCACCTT CAC C CTGGAGC GC AT CAACGC C AGCAC CAGC GAC CT G 2280 



2385 



2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 

GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 234 0 



2281 



2445 



2386 AACAT CACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGA.GT GAAGC GGGGGTC 
I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I II I I I I I I I II I I I I I I I 
2341 AACAT CACTAAGGACACAAGGTTT GCT GAATTGT T GGCT CT GGAGAGT GAAGGGGGGGT C 2400 

2446 C CAGCCCT GGT GGGC CC CAGT GCCTT CAAGATCC C CT T CCT CATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I II 
2401 C CAGCCCT GGT GGGC CCCAGT GC CTTCAAGATC C C CTT C CT CATT C GGCAAAAGAT CAT C 



2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

24 61 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 



2460 



2565 



2520 



2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAC CT GGACAGCCAT CTT AGCT T CTTT GCCT CCAAGC C CAGC CCT AC AGC CAT GAT C CT C 2580 



2685 



2521 



2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 

2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGAGAC 27 00 

2746 CGGCCAG 2752 

I I II I I 
2701 CAGCCAG 2707 



RESULT 8 
AX268596 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 



AX268596 2697 bp 

Sequence 15 from Patent WO0175440. 
AX268596 

AX268596. 1 GI : 16541710 
Rattus sp. 



DNA 



linear PAT 29-OCT-2001 



ORGANISM Rattus sp. 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 
REFERENCE 1 

AUTHORS Cochran, S .W. , Paterson, G. Y. , Ohashi,Y.W., Morris, B.Y. and 

Pratt, J. Y. 
TITLE Schizophrenia related genes 

JOURNAL Patent: WO 0175440-A 15 ll-OCT-2001; 
WELFIDE CORPORATION (JP) 
FEATURES Location/Qualifiers 
source 1. .2697 

/organism="Rattus sp." 
/mol_type=" unas signed DNA" 
/db_xref="taxon: 10118" 

ORIGIN 

Query Match 81.8%; Score 2252.2; DB 6; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GACCT GCTT CCCCACTT C CT GGT GGAGCCCGAGGAT GT GT ACAT CGT CAAGAACAAGC C A 225 

I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT GC C CCACTT C CT GGT AGAGCCT GAGGACGT GT ACAT T GT CAAGAACAAGC C G 180 

Qy 226 GT GCT GCTT GTGTGCAAGGCCGTGCCCGCCACGCAGAT CTT CTTCAAGTGCAACGGG GAG 285 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GT GT T GTT GGT GTGCAAGGCT GT GC CT GCC ACC C AGAT CTT CTT CAAGTGCAAT GGGGAA 240 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I I I I II I I I I I II II I I I I I I I I III I I I I I I II I I I I 

Db 241 T GGGT CC GCCAGGT C GAT CACGTAATT GAACGCAGCACCGACAGCAGCAGC GGATT GC C A 300 

Qy 346 AC CAT GGAGGT C C GCATTAAT GT CT CAAGGCAGC AGGT CGAGAAGGT GTT C GGGCT GGAG 405 

I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 301 AC CAT GGAGGT C C GT AT CAAC GT AT C GAGGCAGCAGGT AGAGAAAGT GTTT GGGCT GGAG 360 

Qy 406 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 465 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 466 TACATCCGCATAGCCAGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 525 

I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 421 T ACAT CCGGATT GC CT ATTT GC GCAAGAACTTT GAGCAGGAGC CACT GGCCAAGGAAGT G 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I I I I I I III 

Db 481 T CACT GGAGCAAGGC ATT GT ACT ACCTT GT C GCCC C C C AGAAGGAAT C CC C CCAGCT GAG 540 



Qy 586 GTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATC 645 

. I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 541 GT GGAGTGGCTT CGAAAT GAGGAC CT C GT GGACC C CT CC CTC GAT CC CAAT GT GT ACAT C 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I || || Mill II II 

Db 661 T GT GT GGC CAAGAACAT C GTAGC CC GT CGCC GAAGCACCTCT GC AGC GGT CAT T GT T TAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

II I II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGC CACC CTGT GC C C AGTAGAC GGCAGC 945 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I II II Ml 

Db 841 T GT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGC CACT CTGT GCC C AGT GGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

Mill i I t I I ! I i I I I I I I i I I I I I I I i I I I I 1 I I I I I I I I I i I I I I I I I I I t I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC C CAGCACCCC GCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 

I I 1 1 1 1 I I I i i 1 I I I I I I I I I I I I I I I I I I I I I I I ! I I I I III II I I I I I II I I 

Db 961 GAGT GCT CT GAC C CAGCACCCC GCAAT GGAGGT GAGGAGTGTC GGGGT GCT GACCT GGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I II I I II II M M II I II II II I I I I I I II II I I I I I I II I II I I I I II M 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I II I I M I I II 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

II I I I I I II II I II I I M I II I I I I I I I M I I I I I I I I I I I M I I I I II III 

Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 ACCTCAGGCTTCCAGCCC GT CAGCAT CAAGCC C AGCAAAGCAGACAAC C C C CAT CT GCT C 1305 

I I I I I I I I I I M I I I I II I II I I M M M II I I I M I I I I I I I II I I I I M MUM 

Db 1201 AC CT CGGGCT T C C AGC CT GT CAGCAT CAAGC C C AGCAAAGCAGACAAC C C C C AC CT GCT C 1260 

Qy 1306 AC CAT CCAGCC GGACCT C AGCAC CAC CACCAC CAC CTACCAGGGCAGT CT CT GT C C C C GG 1365 

I I I II II I I I I I I I I II I M I I M I I I I I I I II I I I I II I I M I I I II III I M 

Db 1261 ACCATCCAGCCAGACCTCAGCACCACCACTACCACCTACCAGGGCAGTCTATGTTCGAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

III I I I I I II II I I III III II Ml I Ml I II III I.I II I II ill I III Mill 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGC GGCCGCCACAC ACT GCAC CAC AGCT CT CC CAC CT CT GAGGC C GAGGAGTT C GT CT CC 1485 



Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I II I I I I I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1606 AT CC C CCCAGAT GC CAT ACC C C GAGGGAAGATCT AT GAGAT CT AC CT C AC GCT GCACAAG 1665 

II I I I I I I I II I I II I II I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1561 AT AC C CCC GGAT GC C AT C CC C C GAGGAAAGATCT AC GAGAT CT AC CT C ACACT GCACAAG 1620 



1666 



1725 



C C GGAAGACGT GAGGTT GCC C CT AGCT GGCT GT C AGACCCT GCT GAGT C CCAT C GTT AGC 

II I I II I I I I I I I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I I I I I I MINIM 
1621 C CAGAAGACGT GAGGTT GCC C CTAGCT GGCT GT CAGACCCT GCT GAGTCCAGT CGTT AGC 1680 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I II I I I II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I II 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I M I I I I I I II I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I II 'III 
1741 GAGCC CAGCCCTGACAGCT GGAGT CTGC GCCTCAAAAAGCAGT CCT GCGAGGGC AGTT GG 1800 

1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I II I I I I I I I M I I II I I II I I I II M I I I I I I I I II I I I I I I I I I I M II I 
1801 GAGGATGT GCT GCACCTT GGTGAGGAGT CACCTT CCCACCT CT ACT ACT GCCAGCT GGAG 1860 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I M I I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I M I I I I I I I I I II I I I II I I I I I III I I M I I I I I I I II I II I I I I I II 

1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

2026 TCCCTCGAGTACAACATCCGGGTCTACTGCCTGCAT GACACCCACGATGCACT CAAGGAG 2085 

II I I I I I I I I I I I I I II I I II I I I I I I I I II I I I M I I I I I I II I I II I I I I I 
1981 T CCCTTGAGT ACAACAT CCGAGT GT ACT GCCTACAC GACACCCACGACGCT CT CAAGGAG 2040 

2086 GT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C C AGGAGCCACGGGT CCT GC AC 2145 

I I I I I I I I I I I I I M I I M I I I I II I I I I I I I I I II I I I I I I I I I II I I II I I I I I 
2041 GTGGTGCAGCTGGAGAAGCAGCTAGGTGGACAGCTGATCCAGGAGCCTCGCGTCCTGCAC 2100 



2146 



2205 



TT CAAGGAC AGT T AC CACAAC CT GCGCCTAT CCAT C C AC GAT GT GC C CAGCTC CCT GT GG 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I II I I I I I I I I I I I I I I I 
2101 TT CAAAGACAGTT AC CACAAC CT AC GT CTCT CCAT C CACGACGT GCC CAGCTC CCT GT GG 2160 

2206 AAGAGTAAGCTCCTT GT CAGCTACCAGGAGATCCCCTTTTATCACATCTGGAAT GGCACG 2265 

I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I Mill I I I I I II II II I II I I 

2161 AAGAGCAAGCTACTT GT CAGCTACCAGGAGATCCCTTTTTACCACATCTGGAACGGCACC 2220 

2266 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2325 

II I I III II I I II II I M I II I I I I I II I II I III I II I I I I I II I I I I II 



Db 



2221 CAGCAGT AT CT GCACTGCACCTT CACCCT GGAGCGC AT CAACGCC AGC AC CAGC GAC CT G 



2280 



Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GCCTGCAAGGTGTGGGTGTGGCAGGTGGAGGGAGATGGGCAGAGCTTCAACATCAACTTC 2340 

Qy 2386 AACAT CACCAAGGACACAAGGTT TGCT GAGCT GCT GGCT CT GGAGAGT GAAGCGGGGGT C 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2341 AACAT CACTAAGGACACAAGGTTTGCT GAATTGTT GGCTCT GGAGAGT GAAGGGGGGGTC 2400 

Qy 2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAAAAGATCATC 2460 

Qy 2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GCCAGTCTGGACCCACCCTGCAGCCGGGGCGCCGACTGGAGAACTCTAGCCCAGAAACTT 2520 

Qy 2566 C ACCT GGACAGC CAT CT CAGCTT CTTT GCCT CCAAGC CC AGCC CCACAGCC AT GAT CCT C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTTAGCTT CTTT GCCT CCAAGC CCAGCCCT AC AGCC AT GAT CCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 264 0 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 



RESULT 9 
RNU87305 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 



RNU87305 2697 bp mRNA linear ROD 15-MAY-1997 

Rattus norvegicus transmembrane receptor UncSHl mRNA, complete cds . 
U87305 

U87305..1 GI:2055391 

Rattus norvegicus (Norway rat) 
Rattus norvegicus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 

1 (bases 1 to 2697) 

Leonardo , E.D. , Hinck,L., Masu,M., Keino-Masu, K . , Ackerman,S.L. and 
Tessier-Lavigne, M. 

Vertebrate homologues of C. elegans UNC-5 are candidate netrin 
receptors 

Nature 386 (6627), 833-838 (1997) 

97271897 

9126742 

2 (bases 1 to 2697) 

Leonardo, E. D. , Hinck,L., Masu,M., Keino-Masu, K. and 
Te s s i e r-La vi gne , M . 
Direct Submission 

Submitted (28- JAN-1997) Anatomy, UCSF, 513 Parnassus, San 
Francisco, CA 94143-0452, USA 



FEATURES Location/ Qualifiers 

source 1. .2697 

/organism="Rattus norvegicus" 
/mol_type="mRNA" 
/db_xref="taxon: 10116" 

/tissue_type="brain and ventral spinal cord 11 
/dev_stage="18 day embyo and 13 day embryo" 
CDS 1. .2697 

/codon_start=l 

/product=" transmembrane receptor UNC5H1" 
/protein_id="AAB57678 . 1" 
/db_xref ="GI : 2 055392 " 

/ trans la tion="l^VRPGLWPVLLGIVLAAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVTIVl^NKPvXLVCKAVPATQIFFKCNGEWVRQVDHVIERSTDSSSGLPTM 
EVRIWSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLVVRQARLADTAN 
YTCVAKNIVARRRSTSAAVTVYVNGGWSTWTEWSVCSASCGRGWQKRSRSCTNPAPLN 
GGAFCEGQNVQKTACATLCPVDGSWSSWSKWSACGLDCTHWRSRECSDPAPRNGGEEC 
RGADLDTRNCTSDLCLHTASCPEDVALYIGLVAVAVCLFLLLLALGLIYCRKKEGLDS 
DVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCSRQDGPSPKFQL 
SNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFLGG 
RLMI PNTGI SLLI PPDAI PRGKI YEI YLTLHKPEDVRLPLAGCQTLLS PWSCGPPGV 
LLTRPVI LAMDHCGEP S PDSWSLRLKKQS CEGSWEDVLHLGEES PSHLYYCQLEAGAC 
YVFTEQLGRFALVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKEW 
QLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGT 
QQYLHCTFTLERINASTSDIACKWWQVEGDGQSFNINFNITKDTRFAELLALESEG 
GVPALVGPSAFKI P FLI RQKI I AS LDP PCS RGADWRTLAQKLHLDSHLS FFAS KPS PT 
AMILNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVSEAEC" 

ORIGIN 



Query Match 81.8%; Score 2252.2; DB 10; Length 2697; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2419; Conservative 0; Mismatches 278; Indels 0; Gaps 0; 

Qy 46 ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 



Qy 106 CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

Qy 166 GAC CT GCTT CCCCACTT C CT GGT GGAGC CC GAGGATGT GT ACAT CGTCAAGAACAAGC C A 225 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GACCT GCT GCCCCACTTC CT GGT AGAGC CT GAGGACGT GT ACATT GTCAAGAACAAGC C G 180 



Qy 226 GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 181 GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

Qy 286 TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 

I I I I I I I I I I I I I II I I I I I II II I I I II I I I III I I I I I I II I I I I 
Db 241 T GGGT C C GC C AGGT CGAT CACGT AATT GAACGC AGCAC C GAC AGC AGC AGC GGAT T GCC A 300 

Qy 346 ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 

I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 301 ACCAT GGAGGT C C GT AT CAAC GT AT CGAGGCAGCAGGT AGAGAAAGT GTTT GGGCT GGAG 360 



Qy 406 GAATACTGGT GC C AGT GC GT GGC AT GGAGCT CCT CGGGC ACC ACCAAGAGT CAGAAGGC C 465 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 

Db 361 GAATACTGGTGCCAGTGTGTGGCATGGAGCTCCTCGGGTACCACCAAAAGTCAGAAGGCC 420 

Qy 466 T ACAT C CGCAT AGCC AGAT T GCGCAAGAACTT CGAGCAGGAGC CGCTGGC CAAGGAGGT G 525 

I I I I I I I I II III I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I III 

Db 421 TACATCCGGATTGCCTATTTGCGCAAGAACTTTGAGCAGGAGCCACTGGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

II I I I I I I I I I I I I I II II II II II II II II II I I I I I II I I I III 

Db 481 TC ACT GGAGCAAGGCAT T GT ACT ACCT T GT C GC CCCC CAGAAGGAAT C CC CC CAGCT GAG 540 

Qy 586 GT GGAGTGGCT CCGGAAC GAGGAC CT GGT GGACC CGT CC CTGGAC C CCAAT GT AT ACAT C 645 

I I I II I I I I II II II II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 

Db 541 GTGGAGTGGCTTCGAAATGAGGACCTCGTGGACCCCTCCCTCGATCCCAATGTGTACATC 600 

Qy 646 AC GCGGGAGCAC AGCCT GGT GGT GC GACAGGCC C GC CTT GCT GACACGGC CAACT ACAC C 705 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I 

Db 601 ACGCGGGAGCACAGCCTAGTCGTGCGTCAGGCCCGCCTGGCCGACACGGCCAACTACACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 

Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 TGT GAGGGGCAGAAT GT C CAGAAAAC AGC CT GCGCCACC CTGT GC C CAGT AGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

Db 841 TGT GAGGGGCAGAAT GT CCAGAAAACAGC CT GCGCCACT CTGT GC C CAGT GGAT GGGAGC 900 

Qy 946 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCTCT GAC CCAGCACCC C GCAAC GGAGGGGAGGAGT GC C AGGGCACT GAC CT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I I I 

Db 961 GAGT GCTCT GACC CAGCACCC CGCAAT GGAGGT GAGGAGT GT C GGGGT GCT GAC CT GGAC 1020 

Qy 1066 ACC CGCAACTGT ACCAGT GAC CT CT GT GT ACAC AGT GCTT CT GGCC CT GAGGAC GT GGC C 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 114 0 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 1245 

III I I I I II II I I I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I I I III 

Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1246 ACCT CAGGCTT C CAGCC C GT CAGCATCAAGCCC AGCAAAGC AGACAACC CC C AT CT GCT C 1305 

I I I II I I I I I II I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1201 ACCT CGGGCTT CCAGCCT GT CAGCAT CAAGC CCAGCAAAGCAGACAACC CC C AC CT GCT C 1260 

1306 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1365 
I I I I I II I I I I I I I I I I I II I I I I I I II I I II I I I I I I I I I I I I I I I I III I II 
AC C ATC CAGC CAGACCT CAGCAC C AC CACTACCAC CT ACCAGGGC AGT CT AT GTT C GAGG 1320 



1261 



1366 



1321 



CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 



1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 AGT GGC CGC CAT AC GTT GC ACCAC AGCT CACCCAC CT CT GAGGCT GAGGACTT CGT CT CC 1440 

1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I 11 I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

1606 AT CCCCC CAGAT GC CAT AC C CCGAGGGAAGATCT AT GAGAT CT AC CT CAC GCT GCACAAG 1665 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT ACCC C C GGAT GC CAT CCCCCGAGGAAAGATCT AC GAGAT CTAC CT CAC ACTGCACAAG 1620 



1561 



1725 



1666 CC GGAAGAC GT GAGGTT GCCCCTAGCT GGCT GT CAGACCCT GCT GAGTC C C ATCGTT AGC 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1621 CCAGAAGAC GT GAGGTT GC CC CT AGCT GGCT GT CAGACCCT GCT GAGTC CAGT C GTT AGC 1680 

1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

1786 GAGC CCAGC CCT GACAGCT GGAGCCT GCGC CTCAAAAAGCAGT CGT GCGAGGGCAGCT GG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I III 
1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I II II II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I 
1801 GAGGAT GT GCT GCACCTT GGTGAGGAGT CAC CTT C CC AC CT CTAC TACT GC C AGCT GGAG 1860 

1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 



1966 



1921 



2026 



CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 
I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I II 
CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 



T C CCTCGAGT ACAACAT CC GGGT CT ACT GC CTGC AT GAC AC CCACGAT GCACT CAAG GAG 2085 

I I II I I I I I I I I I I I I I I I II MINIM II I I I I 1 I I 1 I I I II MINIMI 

1981 TCCCTTGAGT ACAACAT CCGAGTGTACTGCCTACACGACACCCACGACGCT CT CAAGGAG 2040 
2086 GT GGTGCAGCTGGAGAAGC AGCT GGGGGGACAGCT GAT C C AGGAGC C ACGGGT C CT GC AC 2145 



Db 



I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 

2041 GT GGTGC AGCT GGAGAAGC AGCT AGGT GGACAGCT GAT C CAGGAGC CT CGC GT CCT GCAC 



2100 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2146 TT CAAGGACAGTT AC CACAACCT GCGCCT AT CC AT C C AC GAT GT GCCCAGCT CCCT GTGG 2205 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I II I I I I I I I I 
2101 TT CAAAGACAGTT AC CACAACCT AC GTCT CT CC AT C C ACGAC GT GCCCAGCT CCCT GTGG 2160 



2206 AAGAGTAAGCT C CTT GT C AGCT AC CAGGAGATC C C CTTTT AT CACAT CT GGAAT GGCACG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AAGAGCAAGCT ACTT GT CAGCT AC CAGGAGATCC CT TTTT AC CACAT CT GGAAC GGCACC 



2266 



2265 



2220 



2325 



CAGC GGT ACTT GC ACTGC AC CTT CACC CT GGAGC GT GT CAGCCC CAGCACT AGT GACCT G 
I I I I III I I I I I I I I II I I I I I I I I I I I I I I I III I I I I I I I I II I I I I I I 
2221 C AGCAGT AT CT GC ACTGC AC CTT CACCCT GGAGC GCAT C AACGC CAGCACCAGC GACCTG 2280 



2326 



2385 



GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 

111111111 I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I Ml I I 
2281 GC CT GCAAGGT GT GGGT GT GGCAGGTGGAGGGAGAT GGGCAGAGCT T CAACAT CAACTT C 2340 



2386 



2445 



AACATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTC 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 AACATCACTAAGGAC ACAAGGTTT GCT GAATTGT T GGCT CT GGAGAGTGAAGGGGGGGTC 24 00 

2446 CCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I II 
2401 CCAGCC CT GGTGGGC CCCAGT GC CTT CAAGATC CC CT T CCT CATT C GGCAAAAGAT CAT C 24 60 

2506 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2565 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 61 GCCAGT CT GGACCCACCCT GCAGCCGGGGCGCC GACT GGAGAACT CT AGC CC AGAAACTT 2520 

2566 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 
2521 CACCTGGACAGCCATCTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTC 2580 

2626 AACCT GT GGGAGGC GCGGCACTTC CCCAACGGCAAC CT CAGC CAGCT GGCT GCAGCAGTG 2 685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2581 AACCTATGGGAGGCACGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCAGCAGCTGTG 2640 



2686 



2742 



GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2641 GCCGGACTGGGCCAACCAGATGCTGGCCTCTTCACGGTGTCGGAGGCCGAGTGTTGA 2697 
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This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi: 23346570. 
FEATURES Location/Qualifiers 
source 1. .3844 

/organism="Mus mus cuius" 
/mol_type="mRNA" 



/strain= M C57BL/6 M 
/db_xref="taxon: 10090" 
/clone="MGC: 66671 IMAGE : 6813463" 

/tissue_type="Brain, mouse, 13.5, 14.5, 16.5, 17.5 dpc" 

/clone_lib="NIH__BMAP_FW0" 

/lab_host="DH10B" 

/note="Vector: pYX-ASC" 
gene 1. .3844 

/gene="Unc5a" 

/db_xref="LocusID: 107448" 

/db_xref="MGI: 894682" 
CDS 252. .2780 

/gene="Unc5a" 

/ codori_start=l 

/product="Unc5a protein" 

/protein_id="AAH58084 . 1" 

/db_xref ="GI : 34784159" 

/db_xref="LocusID: 107448" 

/db_xref ="MGI : 894 682 " 

/ trans la tion="MAVRPGLWPALLGIVLTAWLRGSGAQQSATVANPVPGANPDLLP 
HFLVEPEDVYI VKNKPVLLVCKAVPATQI FFKCNGEWVRQVDHVT ERSTDGS S GLPTM 
EVRINVSRQQVEKVFGLEEYWCQCVAWSSSGTTKSQKAYIRIAYLRKNFEQEPLAKEV 
SLEQGIVLPCRPPEGIPPAEVEWLRNEDLVDPSLDPNVYITREHSLWRQARLADTPN 
YTCVAKNIVARRRSASAAVIVYVDGSWSPWSKWSACGLDCTHWRSRECSDPAPRNGGE 
EC RGADLDT RN CT S DL C LHT S S G P E DVAL YI GLVAVAVC L I LL LLVLVL I YCRKKEG L 
DSDVADSSILTSGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKF 
QLSNGHLLSPLGSGRHTLHHSSPTSEAEDFVSRLSTQNYFRSLPRGTSNMAYGTFNFL 
GGRLMI PNTGISLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPP 
GVLLTRPVILAMDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEESPSHLYYCQLEAG 
ACYVFTEQLGRFTUjVGEALSVAATKRLRLLLFAPVACTSLEYNIRVYCLHDTHDALKE 
WQLEKQLGGQLIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWN 
GTQQYLHCTFTLERWASTSDLACKVWVWQVEGDGQSFNINFNITKDTRFAEMLALES 
EGGVPALVGPSAFKIPFLIRQKIITSLDPPCSRGADWRTLAQKLHLDSHLSFFASKPS 
PTAMI LNLWEARHFPNGNLGQLAAAVAGLGQPDAGLFTVS EAEC " 
misc_feature 714. .926 

/gene="Unc5a" 

/note="IG; Region: Immunoglobulin" 
/db_xref="CDD:smart00409 M 
misc_feature 984. .1130 

/gene="Unc5a" 

/note="TSPl; Region: Thrombospondin type 1 repeats" 
/db_xref="CDD:smart00209" 
misc_feature 1566. .1877 

/gene="Unc5a" 

/note="ZU5; Region: Domain present in ZO-1 and Unc5-like 
netrin receptors" 
/db_xref="CDD:smart00218" 
misc_feature 2496. .2684 

/gene="Unc5a" 

/ note="DEATH; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis) . Alpha-helical domain 
present in a variety of proteins with apoptotic functions . 
Some (but not all) of these domains form homotypic and 
heterotypic dimers" 
/db xref="CDD:smart00005" 



ORIGIN 



Query Match 72.1%; Score 1983.6; DB 10; Length 3844; 

Best Local Similarity 84.3%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 264; Indels 168; Gaps 1; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I 

Db 207 CCGCCCGCGGGGCCCCTAGTCCAGCCCGCTCGTCCGCCCGCGGCCATGGCCGTCCGGCCC 266 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I 
Db 267 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCACTGCCTGGCTTCGTGGTTCGGGTGCC 326 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 327 CAGCAGAGTGCCACAGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTGCCCCAC 386 

Qy 181 TT C CT GGT GGAGCCCGAGGAT GT GT ACAT C GTCAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 387 TT C CT GGT AGAGCCGGAGGAC GT GT AC ATT GTCAAGAACAAGC CC GTGCT GCT GGT GT GC 446 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 AAGGCTGTGCCCGCCACCCAGATCTTCTTCAAGTGCAACGGGGAATGGGTTCGCCAGGTC 506 

Qy 301 GACCAC GT GAT CGAGC GC AGCACAGAC GGGAGCAGT GGGCTGC CCACC AT GGAGGT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 507 GAT CAC GT CATT GAACGCAGCACT GACGGCAGCAGC GGATTGC CAACCAT GGAGGT C C GG 566 

Qy 361 ATTAAT GT CTCAAGGCAGCAGGT C GAGAAGGT GTTC GGGCTGGAGGAAT ACT GGT GC C AG 420 

II II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I I I I I I 

Db 567 AT CAAC GT ATCAAGGCAGCAGGT CGAGAAAGT GTTT GGGCTGGAGGAGT ACT GGT GC CAG 626 

Qy 421 TGC GT GGCATGGAGCTCCT C GGGCAC CAC CAAGAGT CAGAAGGCCT AC AT C C GC AT AGC C 480 

II I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I II III 
Db 627 TGT GT GGCATGGAGCT CCT CAGGAAC CAC CAAAAGC CAGAAGGCCT ACAT C C GGATT GC C 686 

Qy 481 AGATT GCGCAAGAACTT C GAGCAGGAGCCGCT GGCCAAGGAGGTGT CC CT GGAGCAGGGC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 687 TATTTGCGCAAGAACTTTGAGCAGGAGCCGCTGGCCAAGGAAGTGTCACTGGAGCAAGGC 746 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

II I I I I I II II II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 ATTGTGCTACCTTGTCGCCCCCCGGAAGGAATCCCCCCAGCTGAGGTGGAGTGGCTCCGA 806 

Qy 601 AACGAGGACCT GGT GGACCC GT C C CT GGAC C C CAAT GT AT ACATCACGC GGGAGC ACAGC 660 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 807 AAT GAGGACCT C GT GGACC CCT C C CT C GAC C CCAAT GTGT AC ATCACAC GGGAGCACAGC 866 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 867 CTAGTCGTGCGGCAGGCCCGCCTGGCCGACACTCCCAACTACACCTGCGTGGCCAAGAAC 926 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I MINIM II II I I I I I II II III 
Db 927 ATCGTGGCCCGTCGCCGAAGCGCCTCTGCGGCCGTCATTGTTTATGTG 974 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



975 974 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

975 974 

901 GT C CAGAAAACAGC CT GC GCC AC C CT GT GC C C AGT AGACGGC AG CT GGAGC C CGT GGAGC 960 

II II I I I I I I I I I I I I I I I I 
975 GAT GGGAGCT GGAGC C CAT GGAGT 998 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

999 AAGTGGTCAGCCTGCGGGCTTGACTGCACCCACTGGC GGAGC CGGGAGTGCTCCGAC CCA 1058 

1021 GCAC C C CGCAAC GGAGGGGAGGAGT GCC AGGGC ACT GACCT GGACAC C C GCAACT GT AC C 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
1059 GCGCCCCGCAACGGAGGTGAGGAGTGCCGGGGTGCTGACCTGGACACCCGCAACTGTACC 1118 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1119 AGTGACCTCTGCCTGCACACCTCTTCCGGCCCCGAGGACGTGGCTCTCTACATCGGCCTC 1178 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1179 GTCGCCGTGGCCGTGTGCCTCATCTTGCTGCTGCTGGTCCTCGTCCTCATCTACTGCCGC 1238 

1201 AAGAAGGAGGGGCT GGACT CAGAT GTGGCTGACTCGT C CATT CT CACCT CAGGCTT C CAG 1260 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 
1239 AAGAAGGAAGGACT GGACT CAGACGTGGCTGACT CAT C CATCCTTACCTC AGGCTT C CAG 1298 

12 61 CCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCGGAC 1320 

II 11111111111111111111111111111 I I I I I I I I I I I I I I I I I I I I I I I I I I 
1299 C CT GT C AGCAT CAAGC C CAGCAAAGCAGACAAT CC C C AT CTGCT CAC CAT C CAACCGGAC 1358 

1321 CT CAGC AC CAC CAC CAC CACCTACCAGGGCAGT CT CTGT CCCC GGCAGGAT GGGCCCAGC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1359 CT CAGCAC CACCACGACCACCTACCAGGGCAGCCT GTGT CCCC GGCAGGAT GGACCCAGC 1418 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1419 CCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGCAGTGGCCGCCATACG 1478 

1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I 

1479 CTGCACCACAGCTCCCCCACCTCTGAGGCTGAGGACTTCGTCTCCCGCCTCTCCACCCAA 1538 

1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I II II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 AACTACTTTCGTTCTCTGCCCCGCGGTACCAGCAACATGGCCTATGGGACCTTCAACTTC 1598 

1561 CT CGGGGGC C GGCT GAT GAT C CCTAAT ACAGGT AT CAGC CT CCT CAT C CC C CCAGAT GCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
1599 CTCGGGGGCCGGCTGATGATCCCTAACACAGGAATCAGCCTCCTCATACCCCCGGACGCC 1658 

1621 AT ACCCCGAGGGAAGAT CT AT GAGATCT AC CT C ACGCT GCACAAGCCGGAAGAC GT GAGG 1680 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1659 ATCCCCCGAGGAAAGATCTACGAGAT CTACCTCACT CTGCACAAGCCAGAAGACGTGAGG 1718 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1719 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCTATCGTTAGCTGTGGGCCCCCAGGA 177 8 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II III 
1779 GTCCTGCTCACCCGGCCAGTCATCCTTGCCATGGACCACTGCGGGGAGCCCAGTCCCGAC 1838 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I I I 
1839 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCCTGTGAGGGCAGCTGGGAGGACGTGCTGCAC 1898 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

II II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I II I 

1899 CTTGGTGAGGAGTCGCCCTCTCATCTCTACTACTGCCAGCTGGAGGCCGGGGCCTGCTAT 1958 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 GTCTTTACCGAGCAGCTAGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 2018 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I II I I I I I I I I I I II I I I I I I I I I I I II MINIM II I I I I I I M II I I I I I 
2019 ACCAAGCGCCTCAGGCTCCTTCTGTTTGCCCCTGTGGCCTGTACGTCCCTCGAGTACAAC 2078 

2041 AT CCGGGT CT ACTGC CT GCAT GACAC C CACGAT GCACTCAAGGAGGT GGT GCAGCT GGAG 2100 

I I I II II I I II I I I II I I II M I I I M I I I M M I II I I I I I II II I M I I I I M I 

2079 AT CCGAGT GT ACT GC CT GCACGAC AC CCACGAT GCT CTCAAGGAGGT GGT GCAGCT GGAG 2138 
2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CACGGGTC CTGCACTT CAAGGACAGT T AC 2160 

I I II M I I I I I II I II II I M I II I I I II II M M I M I II I I II II I I I II I I II 

2139 AAGCAGCT GGGT GGACAGCT GAT C C AGGAGCCCC GT GTC CT GCACTT CAAAGAC AGTT AC 2198 

2161 CACAAC CT GCGC CT AT C CAT CCACGAT GT GCCCAGCT CCCTGT GGAAGAGTAAGCT CCT T 2220 

I I I I I I I I II II II II II I I II I M I I I I II I II I II I I I I I I I I I II I II I I I I 
2199 CACAAC CT ACGT CT GT C CATCCAC GACGTGCCCAGCT CCCTGT GGAAGAGCAAGCT CCTT 2258 

2221 GT CAGCT ACCAGGAGAT CC CCTTTT AT CACATCT GGAAT GGCACGCAGC GGT ACTT GCAC 2280 

I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I M I II I I I I I I I III I I I I I 
2259 GT CAGCT ACCAGGAGAT CC CTTTTT AC CACATCT GGAAT GGC ACT CAGCAGT AT CT GCAC 2318 

2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 234 0 

I II I I I I II I I I I II I I M I I I II. I I II I II II I I I II I I I I M I II I I I II I 
TGCACCTTCACCCTGGAGCGCGTCAATGCCAGCACCAGCGACCTGGCCTGCAAGGTGTGG 



2319 



2378 



2341 GT GTGGCAGGT GGAGGGC GACGGGCAGAGCTT CAGC ATCAACTT CAAC AT CAC CAAGGAC 2400 

I I II II I I I I I I I I I I I II II I I M I II I I I I II I I I I II I I I II I II M I II I 
2379 GTGTGGCAGGTGGAGGGAGATGGACAGAGCTTCAACATCAACTTTAACATCACTAAGGAC 2438 

2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

II I I I I I I I II II I I I I I I I I I I I I II I I II I I I II I II I I I I I I I I II I I I I M I 
2439 ACGAGGTTTGCTGAAATGCTGGCTCTGGAGAGTGAAGGGGGGGTCCCAGCCCTGGTGGGC 2498 

2461 CC CAGT GC CTT CAAGAT C C C CTT CCT CATT C GGCAGAAGAT AATTT CCAGCCT GGAC C CA 2520 

I I I II I II I I I I I I I I I I I I I I I II I I II I II II I II I I I I II I I I I I I I I I II I I I 
2499 CC C AGT GC CTT CAAGAT CC CCT T C CT CATT C GGCAAAAGATC ATT ACCAGCCT GGAC C CA 2558 



Qy 

Db. 



2521 
2559 



CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 

I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I 
CCCTGCAGCCGGGGCGCCGACTGGCGAACTCTAGCCCAGAAACTTCACCTGGACAGCCAT 



2580 
2618 



Qy 

Db 

Qy 

Db 

Qy 
Db 



2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

II I I I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
2619 CTTAGCTTCTTTGCCTCCAAGCCCAGCCCTACAGCCATGATCCTCAACCTATGGGAGGCG 2678 

2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2679 CGGCACTTCCCCAACGGCAACCTCGGCCAGCTGGCCGCAGCTGTGGCCGGACTGGGCCAG 2738 

2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2739 CC AGAT GCT GGCCT CTT CACCGT GT C AGAGGCC GAGT GCT GAGACC AGC CAG 2790 
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BC009333 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/ LLNL at: http://image.llnl.gov 
Series: IRAL Plate: 26 Row: g Column: 22. 
FEATURES Location/Qualifiers 
source 1. .2688 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ clone= " IMAGE :4126760" 

/tissue_type="Brain, neuroblastoma" 

/ clone_lib= "NIH_MGC_1 9 " 

/lab_host="DH10B-R" 

/note="Vector: p0TB7" 
gene <1. .2688 

/gene="UNC5A" 

/note="synonym: UNC5H1" 

/db_xref="LocusID: 90249" 

/db_xref="MIM: 607869" 
CDS <1. .1627 

/gene="UNC5A" 

/ codon_s tar t=2 

/product="UNC5A protein" 

/protein_id="AAH09333 . 2 " 

/db_xref="GI : 40226528" 

/db__xref="LocusID: 90249" 

/db__xref="MIM: 607869" 

/translation="DVALYVGLIAVAVCLVLLLLVLILVYCRKKEGLDSDVADSSILT 
SGFQPVSIKPSKADNPHLLTIQPDLSTTTTTYQGSLCPRQDGPSPKFQLTNGHLLSPL 
GGGRHTLHHSSPTSEAEEFVSRLSTQNYFRSLPRGTSNMTYGTFNFLGGRLMIPNTGI 
SLLIPPDAIPRGKIYEIYLTLHKPEDVRLPLAGCQTLLSPIVSCGPPGVLLTRPVILA 
MDHCGEPSPDSWSLRLKKQSCEGSWEDVLHLGEEAPSHLYYCQLEASACYVFTEQLGR 
FALVGEALSVAAAKRLKLLLFAPVACTSLEYNIRVYCLHDTHDALKEWQLEKQLGGQ 
LIQEPRVLHFKDSYHNLRLSIHDVPSSLWKSKLLVSYQEIPFYHIWNGTQRYLHCTFT 



misc feature 



misc feature 



LERVSPSTSDLACKLWVWQVEGDGQSFSINFNITKDTRFAELLALESEAGVPALVGPS 
AFKI PFLI RQKI I S SLDPPCRRGADWRTLAQKLHLDSHLS FFASKPS PTAMI LNLWEA 
RH F PN GNL S QLAAAVAGL GQ P DAGLFTVS EAEC " 
413. .724 
/gene="UNC5A" 

/note="ZU5; Region: Domain present in ZO-1 and Unc5-like 

netrin receptors" 

/db_xref="CDD: smart 002 18" 

1343. .1594 

/gene="UNC5A" 

/no t e= " DEATH ; Region: DEATH domain, found in proteins 
involved in cell death (apoptosis) . Alpha-helical domain 
present in a variety of proteins with apoptotic functions. 
Some (but not all) of these domains form homotypic and 
heterotypic dimers" 
/db xref="CDD:smart00005" 



ORIGIN 



Query Match 59.4%; 
Best Local Similarity 99.9%; 
Matches 1636; Conservative 



Score 1635.4; DB 9; 
Pred. No. 2.4e-264; 
0; Mismatches 1; 



Length .2688; 



Indels 



0; Gaps 



0; 



Qy 1116 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 1175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGACGTGGCCCTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCT 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1176 T GT C CTCAT CCT C GTTT ATT GC CGGAAGAAGGAGGGGCTGGACT CAGAT GT GGCTGACT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 11 I I I I I I I I I I I I I I I 
TGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTC 



61 



1236 



121 



1296 



181 



GT CCATT CT CACCT CAGGCTT C CAGCC C GT C AGCAT CAAGC CCAGCAAAGC AGACAACC C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT CCATT CT CACCT CAGGCTT C C AGCC C GT CAGCAT CAAGC CCAGCAAAGC AGACAAC C C 

CCAT CTGCTC ACCAT CCAGCC GGACCT C AGCAC CAC CACCACCAC CT AC C AGGGCAGT CT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C CAT CTGCT CAC CAT CCAGCC GGACCT CAGC ACCAC CACCAC CACCT AC CAGGGCAGT CT 



1235 



120 



1295 



180 



1355 



240 



1356 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 1415 

I I I I I I I I I I I I I I I I I I I I I I I I I II I t I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

241 CTGTCCCCGGCAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAG 300 

1416 CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 1475 

II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGA 



301 



1476 GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTTCGTCTCCCGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAA 



361 



1536 



421 



1596 



481 



CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTAT 

I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAAT 

CAGCCTCCTCATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGC CTCCT C AT CC CC C CAGATGCCAT ACCCCGAGGGAAGATCT AT GAGAT CT ACCT CAC 



360 



1535 



420 



1595 



480 



1655 



540 



\ 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1656 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 1715 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCC 600 

1716 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 1775 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGA 660 

1776 CCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGA 1835 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
661 CCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGA 720 

1836 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 1895 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTG 780 

1896 CCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 1955 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 
CCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGT 840 



781 



1956 



841 



GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 2015 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
GGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGT 900 



2016 GGC CT GCACCTCCCT C GAGT ACAACAT C CGGGT CT ACT GC CT GCAT GACACCCACGAT GC 2075 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 GGC CT GCACCT CCCT C GAGT ACAACAT CCGGGT CT ACT GC CT GCAT GACACCCACGAT GC 960 

2076 ACT CAAGGAGGTGGTGCAGCTGGAGAAGCAGCT GGGGGGACAGCTGATCCAGGAGCCACG 2135 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 ACT CAAGGAGGT GGT GCAGCT GGAGAAGC AGCT GGGGGGACAGCT GAT C CAGGAGC C AC G 1020 

2136 GGT CCT GCACTT CAAGGAC AGTT AC CACAACCT GCG C CT ATCCAT C CAC GAT GT GC C CAG 2195 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 
1021 GGTCCT GCACTT CAAGGACAGTT AC CACAACCT GCGCCT ATCCAT C CAC GAT GT GCCCAG 1080 

2196 CT CCCT GT GGAAGAGTAAGCT C CTT GT CAGCTACCAGGAGAT C CCCTTTT AT CAC AT CT G 2255 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
1081 CT CCCT GT GGAAGAGTAAGCT C CTT GT CAGCTAC CAGGAGAT CCC CTTTT AT CACAT CT G 114 0 

2256 GAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCAC 2315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 GAATGGCACGCAGC GGT ACTT GCACT GCACCTT CAC C CT GGAGC GT GT C AGC C C C AGCAC 1200 

2316 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 2375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 TAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAG 1260 

2376 CAT CAACTT CAACAT CAC CAAGGACACAAGGTT T GCT GAGCT GCT GGCT CT GGAGAGT GA 2435 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CATCAACTTCAACATCACCAAGGACACAAGGTTTGCTGAGCT GCT GGCTCT GGAGAGT GA 1320 

2436 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 2495 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1321 AGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCA 138 0 



Qy 

Db 



2496 
1381 



GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 
I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGC 



2555 
1440 



Qy 2556 CCAGAAACT CCACCT GGACAGCCAT CT C AGCTT CTT T GCCTC CAAGCC CAGCCC CAC AGC 2615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 CCAGAAACT CCACCT GGAC AGC CAT CT C AGCTT CTT T GCCT C CAAGCC CAGCCC CACAGC 1500 

Qy 2616 CAT GAT CCT CAACCT GT GGGAGGC GCGGCACTT CCC CAACGGCAACCT CAGCCAGCT GGC 2675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1501 CATGATCCTCAACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCT CAGCCAGCT GGC 1560 

Qy 2676 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 2735 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 TGCAGCAGTGGCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGA 1620 

Qy 2736 GTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I 
Db 1621 GTGCTGAGGCCGGCCAG 1637 
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BD057525 1787 bp DNA linear PAT 27-AUG-2002 

Netrin receptors . 

BD057525 

BD057525.1 GI: 22603131 
JP 2001505062-A/2. 
synthetic construct 
synthetic construct 

other sequences; artificial sequences. 
1 (bases 1 to 1787) 

Lavigne,M.T. , Leonardo , D. E. , Hinck,L., Masu,M. and Masu,K.K. 
Netrin receptors 

Patent: JP 2001505062-A 2 17-APR-2001; 

THE REGENTS OF THE UNIV OF CALIFORNIA 

PN JP 2001505062-A/2 

PD 17-APR-2001 

PF 19-FEB-1998 JP 1998536840 

PR 19-FEB-1997 US 08/808982 

PI MARC TESSIER LAVIGNE, DAVID E LEONARDO, LINDSAY HINCK, MASAYUKI 
PI MASU, 

PI KAZUKO KEINO MASU 

PC C07Kl/00,C07K14/00, C07K17/00, C07H21/02, C07H21/04, G01N33/53 CC 

Strandedness : Double; 
CC Topology: Linear; 

FH Key Location/Qualifiers. 
Location/Qualifiers 
1. .1787 

/organism="synthetic construct" 
/mol_type=" genomic DNA" 
/db xref="taxon: 32630" 



Query Match 56.8%; 
Best local Similarity 98.5%; 
Matches 1661; Conservative 



Score 1562.4; DB 6; 
Pred. No. 4.3e-252; 
0; Mismatches 16; 



Length 1787; 
Indels 9; Gaps 



8; 



Qy 1070 GCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCT 1129 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GCAACTGTACCAGTGACCTCTG-GTACACACTGCTTCTGGCCCTGAGGACGTGGCCCTCT 59 

Qy 1130 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 1189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 60 ATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCG 119 

Qy 1190 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 1249 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 120 TTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCT 179 

Qy 1250 CAGGCTT C CAGC C CGTCAGCAT C - AAGC CC AGCAAAGCAGACAAC C C C CAT CT GCT CAC C 1308 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I 

Db 180 CAGGCTT C CAGC C C GT C AGCAT CTAAGC CC AGCAAAGCAGACAACC C CCAT CT GCT CAC C 239 

Qy 1309 AT CCAGC C GGAC CT CAGCACCAC CACC ACCACCT ACCAGGGCAGT CT CT GT CC C CGGCAG 1368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

Db 240 AT C CAGC CGGACCT CAGCACCAC CAC CACC ACCT ACCAGGGCAGT CTCT GT CCC CGGCAG 299 

Qy 1369 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 1428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I II I I I I I I I 

Db 300 GATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGC 359 

Qy 1429 GGCCGCCACACACT GCACCACAGCT CT CCCACCT CT GAGGCCGAGGAGTTCGTCTCCCGC 1488 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 

Db 360 GGCCGCCACACACT GCAC CACAGCT CT C CCACCTCT GAGGCCGAGGAGTT C GT CTCCC GC 419 

Qy 1489 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 1548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 420 CTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGG 47 9 

Qy 1549 AC CTT CAACT T C CT C GGGGGC C GGCT GATGATCCCTAAT ACAGGT AT CAGC CT C CT CAT C 1608 

I I I I I I I I I I II I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 480 ACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTCATC 539 

Qy 1609 CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCT GCACAAGCCG 1668 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 540 CCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCTGCACAAGCCG 599 

Qy 1669 GAAGACGT GAGGTT GCCCCT AGCT GGCT GT CAGACCCT GCT GAGT C CC AT C GTT AGCT GT 1728 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 600 GAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGT 659 

Qy 1729 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 1788 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I II I I I I I I I I I I I I I 

Db 660 GGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAG 719 

Qy 1789 CCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAG 1848 

I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 CCCAGCCCTGACAGCTGGAGCCTGGCCCTCAAAAAGCAGTCGTGCGAGGG-AGCTGGGAG 778 

Qy 1849 GATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCC 1908 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 779 GAT GT-CTGCACCTGGGCGAGGAGGCGCCCT CCCACCT CT ACT ACT GCCAGCTGGAGGCC 837 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 



1909 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 1968 

I I I I I I I I I I t I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

838 AGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTC 897 

1969 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I 

898 AGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCC 957 

2029 CT CGAGTACAACATCCGGGT CTACTGCCTGCAT GACACCCACGATGCACT CAAGGAGGTG 2088 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

958 CT CGAGTACAACATCCGGGTCTACTGCCTGCAT GACACCCACGAT GCACT CAAGGAGGT G 1017 

2089 GT GC AGCT GGAGAAGCAGCT G GGGGGACAGCTGAT C CAGGAGC CAC GGGT C CT GCACTT C 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1018 GTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCT GCACTT- 1076 

2149 AAGGACAGTT ACCACAAC CT GC GC CTAT CCATCC AC GAT GTGC CCAGCT C C CT GT GGAAG 2208 

I I I I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

1077 AAGGACAGT T AC CACAAC CT — GC C CT AT CATCC AC GAT GTGC CCAGCT CC CT GT GGAAG 1134 

2209 AGTAAGCT C CTT GT CAGCT AC CAGGAGATC C CCTTTT AT CACAT CT GGAAT GGC AC GC AG 2268 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 

1135 AGTAAGCT C CTT GT CAGCT AC CAGGAGATC C CCTTTT AT CACAT CT GGAAT GGC AC GCAG 1194 



2269 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1195 CGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCC 



2328 



1254 



2388 



2329 TGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1255 TGCAAGCTGTGGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTTCAGCAT CAACTT CAAC 1314 

2389 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 244 8 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1315 ATCACCAAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCA 137 4 

2449 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 2508 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1375 GCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCC 1434 

2509 AGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCAC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1435 AGC CT GGACCCACCCT GTAGGC GGGGT GCC GACT GGCGGACT CT GGCC CAGAAACT CCAC 1494 

2569 CT GGACAGCCAT CT C AGCTT CTTT GC CT C CAAGC C C AGC CCCACAGCC AT GAT C CT CAAC 2628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1495 CT GGAC AGC C AT CT CAGCT T CTTTGCCTC CAAGC CC AGC CCCACAGCC AT GAT C CT CAAC 1554 

2 62 9 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 2688 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1555 CTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCT 1614 

2689 GGACTGGGCCAGCCAGACGCTGGCCTC-TTCACAGTG-TCGGAGGCTGAGTGCTGAGGCC 274 6 

II II II II I I I I I I M I II I I I I I I I I I I III II I I I I I I I I I I I II I II 
1615 GGGACTGGCCAGCAGGACGGTGGCTTCTTTCACAGTGTTCGGAGGCTGAGTGCTGAGGCC 1674 

2747 GGCCAG 2752 



1 1 1 1 1 1 

Db 1675 GGCCAG 



1680 
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linear PAT 13-JAN-2001 



AX054976 9700 bp DNA 

Sequence 91 from Patent WO0073328. 
AX054976 

AX054976. 1 GI : 12228344 



synthetic construct 
synthetic construct 

other sequences; artificial sequences. 
1 

van Criekinge, W. , Roelens,I., Bogaert,T. and Verwaerde, P . 
Unc-5 constructs and screening methods 
Patent: WO 0073328-A 91 07-DEC-2000; 
Devgen NV (BE) 

Location/Qualifiers 

1. .9700 

/organism^" synthetic construct" 
/mo l_type="unas signed DNA" 
/db_xref="taxon: 32630" 
/note="plasmid pGC1037" 



ORIGIN 



Query Match 47.4%; 
Best Local Similarity 99.8%; 
Matches 1306; Conservative 



Score 1304.2; DB 6; 
Pred. No. 6.8e-209; 
0; Mismatches 3; Indels 



Length 9700; 

0; Gaps 



0; 



Qy 



Db 



1437 CACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCAC 1496 
I I I I I I I II I II I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
7 CAC ACT GCACCACAGCT CT C C CAC CT CT GAGGC C GAGGAGTT CGT CTCCCGCCTCTC C AC 66 



Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



1497 CCAGAACT ACTT CCGCTC C CT GCCC C GAGGCAC CAGCAACATGAC CT ATGGGACCTT CAA 1556 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGAACTACTTCCGCTC C CT GCCCC GAGGCAC CAGCAAC AT GAC CT AT GGGACCTT CAA 126 



67 



1557 



127 



CTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGA 1616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTT CCT CGGGGGCCGGCT GAT GAT C C CTAAT AC AGGAAT CAGCCT CCT CAT CC C CCCAGA 186 



1617 T GC CAT ACCCCGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GCACAAGC CGGAAGAC GT 1676 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GC CAT ACCCCGAGGGAAGAT CT AT GAGAT CT AC CT CACGCT GCACAAGC CGGAAGAC GT 246 



187 



1736 



1677 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

247 GAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCC 306 

1737 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 1796 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

307 TGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCC 366 



Qy 1797 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1856 



Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



367 TGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCT 426 
1857 GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 1916 

I I I I I I I I I I I II I 1 1 I I 1 1 I I I I 1 1 1 1 I I I I 1 1 I U I I I I I I I I I 1 1 I I I 1 1 I I I I I 1 1 

GCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTG 



427 



486 



1917 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 1976 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
487 CTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGC 546 

1977 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 2036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
547 TGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTA 606 

2037 CAACATC C GGGTCT ACT GCCT GCAT GACAC CCAC GAT GCACTCAAGGAGGT GGT GCAGCT 2096 
I I I I I I II I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CAACAT C C GGGT CT ACT GCCT GCAT GACAC C CAC GAT GC ACT CAAGGAGGT GGT GCAGCT 



607 



666 



2097 GGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGC CAC GGGT C CTGCACTT CAAGGAC AG 2156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

667 GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CACGGGT C CT GCACTT CAAGGAC AG 726 



2157 



727 



2217 



787 



2277 



847 



2337 



907 



2397 



967 



TTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCT 2216 

I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TT ACCACAACCT GC GCCT AT C CAT CCAC GAT GT GC C CAGCT CC CTGT GGAAGAGTAAGCT 786 

CCTT GT CAGCTACCAGGAGAT CCCCTT TTAT CAC AT CT GGAAT GGCACGCAGC GGT ACT T 2276 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C CTT GT CAGCTACCAGGAGAT C CCCTT TTAT CACAT CT GGAAT GGCACGCAGC GGT ACT T 



GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCT 

GT GGGTGT GGCAGGT GGAGGGC GACGGGCAGAGCTT CAGCATCAACTT CAACAT CAC CAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 il i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GT GGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCATCAACT T CAACAT CAC CAA 



846 



2336 



906 



2396 



966 



2456 



GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGT 

I I I I I I II I I I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 

GGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCAAGCCCTGGT 1026 



2516 



2457 GGGCCCCAGT GCCT T CAAGATC C C CTT C CT C ATT C GGCAGAAGAT AAT TT CCAGCCT GGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1027 GGGCCCCAGT GC CT T CAAGAT CCCCTTCCT C ATT C GGCAGAAGAT AAT TT C CAGCCT GGA 1086 



2517 



2576 



CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1087 CCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAG 1146 

2577 CCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGA 2636 

I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
1147 C CAT CT CAGCT T CTTT GC CT C CAAGC C C AGC CC CACAGC CAT GAT C CT CAACCT GT GGGA 1206 

2637 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 2696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1207 GGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGG 1266 



Qy 

Db 



2697 CCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGC 2745 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I 1 I I I I I I I I 

1267 C C AGC CAGAC GCT GGCCT CT T CACAGT GTC GGAGGCT GAGT GCT GAGT C 1315 
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MMU72634 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



gene 
CDS 



MMU72634 9299 bp mRNA linear ROD 13-MAY-1997 

Mus musculus rostral cerebellar malformation protein (rem) mRNA, 
complete cds . 
U72634 

U72634.1 GI:2088526 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 

1 (bases 1 to 9299) 

Ackerman, S.L. , Kozak,L.P., Przyborski, S . A. , Rund,L.A., Boyer,B.B. 
and Knowles,B.B. 

The mouse rostral cerebellar malformation gene encodes an 

UNC-5-like protein 

Nature 386 (6627), 838-842 (1997) 

97271898 

9126743 

2 (bases 1 to 9299) 

Ackerman, S.L. , Kozak,L.P., Rund, L . A. and Knowles,B.B. 
Direct Submission 

Submitted (25-SEP-1996) The Jackson Laboratory, 600 Main Street, 
Bar Harbor, ME 04609, USA 

Location/ Qualifiers 

1. .9299 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57B6/SJL" 

/ db_xr e f = " t axon : 1 0 0 9 0 " 

/ chromosome=" 3" 

/map= "between Amyl and Mpmv9" 

1. .9299 

/ gene="rcm" 

151. .2946 

/gene="rcm" 

/function=" transmembrane receptor" 
/note="similar to C. elegans UNC-5" 
/ codon_start=l 

/product="rostral cerebellar malformation protein" 

/protein_id="AAB54103.1" 

/db_xref="GI: 2088527" 

/ trans la tion="MRKGLRATAARCGLGLGYLLQMLVLPALALLSASGTGSAAQDDE 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHWDERVDETSGLIVREVSIEISRQQVEELFGPEDYWCQCVAWSSAGTTKSRKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEDIIDPAEDRNFYI 
T I DHNLI I KQARLS DTAN YTCVAKNI VAKRKSTTATVI VYVNGGWSTWTEWS VCNS RC 
GRGYQKRTRTCTNPAPLNGGAFCEGQSVQKIACTTLCPVDGRWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCDGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVTVCLA 
ITVWALFVYRKNHRDFESDIIDSSALNGGFQPVNIKAARQDLLAVPPDLTSAAAMYR 



GPWALHDVSDKIPMTNSPILDPLPNLKIKVYNSSGAVTPQDDLAEFSSKLSPQMTQS 
LLENEALNLKNQSLARQTDPSCTAFGTFNSLGGHLI I PNSGVSLLI PAGAI PQGRVYE 
MYVTVHRKENMRPPMEDSQTLLTPWSCGPPGALLTRPVI LTLHHCADPSTEDWKIQL 
KNQAVQGQWEDWWGEENFTTPCYIQLDAEACHILTENLSTYALVGQSTTKAAAKRL 
KLAI FGPLCCS S LE YS I RVYCLDDTQDALKEVLQLERQMGGQLLEEPKALHFKGS I HN 
LRLSIHDIAHSLWKSKLLAKYQEIPFYHIWSGSQRNLHCTFTLERLSLNTVELVCKLC 
VRQVEGEGQI FQLNCTVSEEPTGI DLPLLDPASTITTVTGPSAFSI PLPIRQKLCSSL 
DAPQTRGHDWRMLAHKLNLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 
EMGRHETWS LAAEGQ Y " 

ORIGIN 

Query Match 36.0%; Score 992; DB 10; Length 9299; 

Best Local Similarity 62.7%; Pred. No. 1.5e-156; 

Matches 1660; Conservative 0; Mismatches 925; Indels 63; Gaps 5; 

Qy 149 TGCCTGGTGCCAACCCGGACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACA 208 

111 III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 308 TT CCAT CTGACC CACCT GAGCCATT GCCAC ACT T CCTC ATT GAGCCC GAGGAAGCTT ACA 367 

Qy 209 T CGT CAAGAACAAGCC AGT GCT GCTT GT GT GCAAGGCC GTGCCC GCCACGCAGAT CTT CT 268 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 

Db 368 TTGT GAAGAACAAGCCT GT GAAC CT GTAT T GTAAAGCC AGC C CT GCCACCCAGAT CT ACT 427 

Qy 269 T CAAGT GCAACGGGGAGT GGGT GC GC C AGGT GGACCAC GTGATC GAGCGCAGCACAGACG 328 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I III II I I I I 

Db 428 T CAAGT GCAACAGCGAGT GGGT T CAT C AGAAGGACCAC GT AGTAGAC GAGAGAGT AGAT G 487 

Qy 329 GGAGCAGTGGGCT GC C CACCAT GGAGGT C C GCATTAAT GTCT CAAGGCAGCAGGT CGAGA 388 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 488 AAAC CT CTGGT CTAATT GT GAGAGAAGT GAGC ATT GAGATTT CACGC CAGCAGGT GGAGG 547 

Qy 389 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I 
Db 548 AACTGTTTGGGCCTGAAGATTACTGGTGCCAGTGTGTGGCCTGGAGCTCAGCAGGCACTA 607 

Qy 449 CCAAGAGTCAGAAGGCCT ACAT CCGCAT AGC CAGAT TGC GCAAGAACTT CGAGCAGGAGC 508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 608 C GAAGAGTCGGAAGGCAT ACGT GCGC AT T GCGT AT CTGC GGAAGACATT CGAGC AGGAAC 667 

Qy 509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 668 C CTT GGGAAAGGAAGT GT CCT T GGAGCAGGAAGT CT T ACTC CAGT GT C GGC CAC CT GAAG 727 

Qy 569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 728 G GAT CC CAGT GGCTGAGGTGGAAT GGCT AAAGAAT GAAGAC ATAATT GAT C CT GCT GAAG 787 

Qy 629 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 688 

II II I I I I I I I II I I I I II I I I I I I I I I I I I I II 

Db 788 ATCGGAACTTTT ATATTACT AT C GAT C ACAAC CTGAT C ATCAAG CAAGC CC GACT CT CAG 847 

Qy 689 ACAC GGC CAACT ACAC CT GCGT GGCCAAGAAC AT C GT GGCAC GT C GC CGCAGC GCCT C C G 748 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 848 ATACAGCAAATT AT AC CT GT GT T GCCAAAAAT ATT GTT GCCAAGAGAAAAAGCACC ACAG 907 



Qy 



749 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 808 
I I I I I I I I I I I II II II I I I I I I I I I I II I I I I I I I I I I I I I II II I 



Db 908 CCACTGTCATCGTGTATGTTAATGGTGGCTGGTCCACCTGGACAGAGTGGTCTGTGTGTA 967 

Qy 809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 968 ACAGCCGCT GT GGGC GAGGAT AT CAGAAACGC ACAAGAAC CT GCAC CAAC C CAGC CCC AC 1027 

Qy 869 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 928 

I I I I I I II II II I I I I I I I I I I I I II III I I I I I I I III III I II I I 
Db 1028 T CAAT GGT GGGGCCTT CT GT GAGGGGCAGAGT GT GCAGAAAAT AGC AT GC ACT AC GTT AT 1087 

Qy 929 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 988 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1088 GT CCAGT GGAT GGT AGGT GGACT T C AT GGAGCAAAT GGT CAAC CT GT GGGACT GAAT GC A 1147 

Qy 989 CCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCC 1048 

I I I I I I I I I I I I I I I I I I II MINIM I I II I I I I I I I I I 

Db 114 8 CCCACT GGC GCAGGAGGGAGT GTAC AGCAC CAGC C CCCAAGAAC GGGGGT AAGGACT GT G 1207 

Qy 1049 AGGGCACT GACCT GGACACCCGCAACT GTAC C AGT GACCT CT GT GT ACACAGT GCTT CT G 1108 

I I I I I I I I I II I I I I I I I II I I I I III I I I I I I I 
Db 1208 ATGGCCTGGTCCTCCAATCCAAGAACTGCACTGATGGGCTGTGCATGCAGGCTGCTCCTG 1267 

Qy 1109 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 1165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1268 ACTCAGATGATGTGGCTCTCTACGTGGGGATTGTGATCGCTGTAACAGTCTGTCTGGCGA 1327 

Qy 1166 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 1225 

I I I I I II Ml III I I I I I I I I I I I I I 

Db 1328 TCACTGTTGTGGTGGCCCTGTTTGTGTATCGGAAGAACCACCGTGACTTTGAGTCTGACA 1387 

Qy 1226 T GGCTGACT C GT CC ATT CTCAC CT C AGGCTT C CAGC C C GT C AGCAT CAAGC CCAGCAAAG 1285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1388 TCATTGACTCCTCAGCACTCAATGGCGGCTTTCAGCCTGTGAACATCAAG G 1438 

Qy 1286 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 1345 

I I I I I I I I I I I I III I I I I I I I I I I I I I III III 
Db 1439 CTGCCAGACAAGATCTCCTGGCTGTCCCCCCTGACCTCACCTCAGCTGCAGCCATGTACA 14 98 

Qy 1346 AGGGCAGTCTCTGTCCCCGGCAGGATG GGC CCAGCC CCAAGT T C CAGCT CAC CAA 1400 

III I I I I I I I I I I I I I I II I I I I I I III til fill 

Db 1499 GGGGACCT GT CT AT GCT CTGC AT GAT GT CT C AGACAAAAT C CCAAT GAC CAACT CT C CAA 1558 

Qy 1401 TGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTCCCAC 14 60 

I I I I I I I I I II II I I I I I I I I 

Db 1559 TT CT GGAC C CACTACCCAACTT GAAAAT CAAAGT GT ACAAC AGCT CAGGT GCT GT CACT C 1618 

Qy 1461 CTC TGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCC 1498 

III III I I I I I I I III I I II Ml 
Db 1619 CT CAGGAT GAC CTT GCC GAGTT C T CAT C CAAACT GT C ACC CCAGAT GAC C CAGT C CTT GC 1678 

Qy 1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCA 1534 

I I I I I I I I II I III I 

Db 1679 T AGAGAAT GAGGC C CTTAAC CT GAAGAACCAGAGC CT C GCAAGAC AGACT GAC C CAT C CT 1738 

Qy 1535 ACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTA 1594 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1739 GCACAGCATTT GGTACCTTCAACT CTCT TGGGGGT CAC CT CAT CAT T C CT AATT CAGGAG 1798 



Qy 1595 T CAGC CT C CT CAT C C C C C C AGAT GC CAT AC C CC GAGGGAAGAT CT AT GAGATCT AC CT C A 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1799 TAAGCTTGCTGATTCCCGCTGGGGCCATTCCTCAGGGGAGAGTCTATGAAATGTATGTGA 1858 

Qy 1655 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1859 CT GT ACAC AGGAAAGAAAATAT GAGGCC CCC CAT GGAAGACTCT CAGACCCTACTT AC C C 1918 

Qy 1715 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1774 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1919 CTGTGGTGAGCTGTGGGCCTCCTGGAGCTCTGCTGACCCGCCCTGTCATCCTCACTCTGC 1978 

Qy 1775 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1834 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1979 AT CACTGTGCAGACCCCAGCACCGAGGACTGGAAGATCCAGCTCAAAAACCAGGCAGT GC 2038 

Qy 1835 AGGGCAGCTGGGAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACT 1894 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I III 

Db 2039 AGGGACAATGGGAGGAT GTT GT GGT GGTTGGGGAGGAGAACTT CACAACCC CCT GT T AC A 2098 

Qy 1895 GCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGG 1954 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2099 TT CAGCT GGAT GCAGAGGCTT GCC AT AT CCT CACAGAGAAC CT C AGT ACCT AT GCC CT GG 2158 

Qy 1955 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 2014 

III I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2159 TTGGGCAGTCCACCACCAAAGCAGCTGCCAAGCGTCTTAAACTGGCCATCTTTGGGCCCC 2218 

Qy 2015 T GGC CT GC AC CT CC CTCGAGT ACAACAT CCGGGT CT ACTGCCT GC AT GACACCC ACGAT G 2074 

I I I I I I I I I I I I I I I I I I III I I I I I I I II I I I I I II I I I I II I I I I 
Db 2219 T CTGCT GCTCT T CC CTGGAGTACAGCATT AGAGT CT ACTGCCT GGAT GACACAC AGGAT G 2278 

Qy 2075 C ACT CAAGGAGGT GGT GCAGCT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAG C CAC 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db .2279 C C CT GAAGGAAGTT CTACAACT GGAGAGGCAAAT GGGAGGACAGCT CCT AGAAGAAC C C A 2338 

Qy 2135 GGGT C CT GCACTT CAAGGACAGTT ACCACAAC CT GCGCCT AT CCAT CCACGAT GTGCC C A 2194 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2339 AGGCT CTT CAT TTTAAAGGCAGC AT C CACAAC CT GCGCCT GTCT ATT CAT GACAT C GCC C 2398 

Qy 2195 GCTCC CT GT GGAAGAGTAAGCT CCTTGT CAGCT AC CAGGAGAT CCC CTTTT AT CACAT CT 2254 

I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2399 ATTCCCTCTGGAAGAGCAAATTGCTGGCTAAGTATCAGGAAATTCCATTTTACCACATCT 2458 

Qy 2255 GGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCA 2314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2459 GGAGT GGCT CT CAAAGAAAC CT CCACT GCAC CT T CACT CT GGAAAGACT CAGC CT AAAC A 2518 

Qy 2315 CTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCA 2374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2519 CAGT GGAACT GGTT T GCAAACTCT GT GT GCGGCAGGTT GAAGGAGAAGGGCAGAT CTT CC 2578 

Qy 2375 GCAT CAACTT CAAC AT CACCAAGGAC ACAAGGT T T GCT GAGCT GCT GGCT CTGGAGAGT G 2434 

I I I I I I I I I I I I I II II II I I I I I II 

Db 2579 AGCTCAACTGTACTGTGTCAGAGGAACCTACTGGCATCGACTTACCTCTCCTGGACCCTG 2638 



Qy 

Db 



2435 
2639 



AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 
III I I II II I I I I I I I I I till III I I I I I I 

CTAGTACCATCACCACTGTCACCGGACCAAGTGCTTTCAGCATTCCTCTCCCTATCCGGC 



2494 
2698 



Qy 24 95 AGAAGAT AAT TT CC AGC CT GGAC CCACCCT GT AGGC GGGGT GC C GACT GGC GGACT CT GG 2554 

I I I I I I I MINIMI III I III I I I I I I I II I I I I 

Db 2699 AGAAGCT ATGCAGCAGCCTGGAT GCCCCTCAAACAAGAGGCCAT GACTGGAGGATGCT GG 2758 

Qy 2555 C C C AGAAACT C CAC CT GGACAGC CAT CT CAGCTT CT TT GC CTCCAAGCCCAGCCC CACAG 2614 

I M I I I I I I I M I I I I I I II I II I I I I I II I I I I I I I I I II I I I 
Db 2759 CCCATAAACT CAACCTGGACAGGTACTTGAATTACTTT GCCACCAAATCGAGCCCAACT G 2818 

Qy 2615 C CAT GAT C CT CAAC CT GT GGGAGGC GC GGCACT T CC C CAAC GGCAAC CT CAGCCAGCT GG 2674 

I I I I I I I I I I II I M I I I I M I II I I I I I I I I I I I I I I I II I 
Db 2819 GC GTAAT C CT GGAT CT TT GGGAAGCACAGAACTT CC C AGAT GGAAAC CT GAGCAT GCT GG 2878 

Qy 2675 CTGCAGCAGTGGCT GGACT GGGCCAGCCAGAC GCT GGC CTCTTCACAGTGTCGGAGGCTG 2734 

I II I I II I I I I M I M I I III I I I I I 

Db 2879 CAGCC GT CCT GGAAGAAAT GGGAAGACAT GAGACAGT GGT GTCCT T GGCAGC AGAAGGAC 2938 

Qy 2735 AGTGCTGA 2742 

Ml III 
Db 2939 AGTATTGA 2946 
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AY187310 2962 bp mRNA linear VRT 06-JUN-2003 

Gallus gallus UNC5-like protein 3 mRNA, complete cds . 

AY187310 

AY187310.1 GI:31442350 

Gallus gallus (chicken) 
Gallus gallus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Archosauria; Aves; Neognathae; Galliformes; Phasianidae; 
Phasianinae; Gallus. 

1 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 

Characterization of Netrin-1, Neogenin and cUNC-5H3 expression 
during chick dorsal root ganglia development 
Gene Expr. Patterns 3, 369-373 (2003) 

2 (bases 1 to 2962) 
Guan,W. and Condic,M.L. 
Direct Submission 

Submitted (26-NOV-2002 ) Neurobiology & Anatomy, University of Utah, 
20 North, 1900 East, Salt Lake City, UT 84132-3401, USA 

Location/Qualifiers 

1. .2962 

/organism= f, Gallus gallus" 

/mol_type="mRNA" 

/db_xref="taxon:9031" 

1. .2796 

/codon_start=l 

/product="UNC5-like protein 3" 
/protein_id="AA067275. 1" 
/db xref="GI: 31442351" 



/translation= ,, MGKGLEGTAARCGLGMGYLLHSWLPALAVLGASRPGSAAQDDD 
FFHELPETFPSDPPEPLPHFLIEPEEAYIVKNKPVNLYCKASPATQIYFKCNSEWVHQ 
KDHWDE RVD ET S GL I VC EVS I E I S RQQVEEL FG P E D YWCQ CVAW S S AGT T K S RKAYV 
RIAYLRKTFEQEPLGKEVSLEQEVLLQCRPPEGIPVAEVEWLKNEEVIDPVEDRNFYI 
T I DHNLI I KQARLS DTAN YTCVAKNI VAKRKSTTATVI VYVNGGWSTWTEWSACNS RC 
GRGFQKRTRTCTNPAPLNGGAFCEGQNVQKIACTTLCPVDGKWTSWSKWSTCGTECTH 
WRRRECTAPAPKNGGKDCEGLVLQSKNCTDGLCMQAAPDSDDVALYVGIVIAVIVCLA 
ISVWALFVYRKNHRDFESDIIDSSALNGGFQPVNIKAARQDLLAVPPDLTSAAAMYR 
GPVYALHDVSDKIPMTNSPILDPLPNLKIKVYNTSGAVTPQDELSDFSSKLSPQITQS 
LLENETLNVKNQSLARQTDPSCTAFGTFNSLGGHLVIPNSGVSLLIPAGAVPQGRVYE 
MYVTVHRKEGMRP PVEDSQT LLT PWS CG P PGALLT RPWLTMHHCAEPNMDDWQI QL 
KHQAGQGPWEDWWGEENFTTPCYIQLDPEACHILTETLSTYALVGQSITKAAAKRL 
KLAI FGPLSCSSLEYS I RVYCLDDTQDALKEVLQLERQMGGQLLEEPKTLHFKGSTHN 
LRLSIHDIAHSLWKSKLPAKYQEIPFYHIWSGCQRNLHCTFTLERFSLNTLELVCKLC 
VRQVEGEGQIFQLNCSVSEEPTGIDYPIMDSAGSITTIVGPNAFSIPLPIRQKLCSSL 
DAPQTRGHDWRMLAHKLKLDRYLNYFATKSSPTGVILDLWEAQNFPDGNLSMLAAVLE 
EMGRH ETWS LAAEGNY " 



ORIGIN 



Query Match 36.0%; Score 991; DB 5; Length 2962; 

Best Local Similarity 62.6%; Pred. No. 2.6e-156; 

Matches 1662; Conservative 0; Mismatches 930; Indels 63; Gaps 5; 

Qy 149 T GC CT GGT GCCAAC C CGGACCT GCT T C C CCACTT CCT GGT GGAGC C CGAGGATGT GT AC A 208 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 158 TT C CT T CT GAT C CT C CAGAGC C ATT GCC C CACTTTCT CATTGAAC C CGAAGAAGCT T ACA 217 

Qy 209 TCGTCAAGAACAAGCCAGTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCT 268 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 218 TC GTGAAAAACAAGC CT GT GAAT CT GT ACT GCAAAGCGAGCCCTGC CAC GCAGAT CT ATT 277 

Qy 269 T CAAGT GCAACGGGGAGT GGGT GC GC CAGGT GGAC CACGT GAT CGAGC GC AGC ACAGAC G 328 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I 

Db 278 TT AAGT GCAAC AGT GAAT GGGTT CAT CAGAAGGAT CAT GT GGT GGATGAGAGAGT AGAT G 337 

Qy 329 GGAGCAGT GGGCTGC CCAC CAT GGAGGT CC GCAT T AAT GT CT CAAGGCAGCAGGT CGAGA 388 

II I I I I II I I I I I I I I I I I I III I I I I I I I I I I I 
Db 338 AAACCT CT GGT CTGATC GT CT GT GAGGT GAGCAT CGAGATTT C CC GCC AGCAGGT GGAAG 397 

Qy 389 AGGTGTTCGGGCTGGAGGAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCA 448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 398 AGCTCTTTGGACCCGAGGACTACTGGTGCCAGTGTGTCGCCTGGAGCTCAGCTGGCACCA 457 

Qy 449 CCAAGAGT CAGAAGGCCT ACAT CCGCAT AGC CAGATT GC GCAAGAACTT CGAGCAGGAGC 508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 458 CCAAGAGC C GCAAGGCCT ACGT CCGC ATT GCAT AT CT CAGAAAGACTTTTGAGC AGGAGC 517 

Qy 509 CGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGG 568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 518 CGCTGGGGAAAGAAGTGTCCCTGGAGCAAGAGGTCCTGCTCCAGTGCCGTCCTCCTGAAG 577 

Qy 569 GCATCCCTCCAGCCGAGGTGGAGTGGCTCCGGAACGAGGACCTGGTGGACCCGTCCCTGG 628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 578 GCATT CCAGTAGCT GAGGTAGAGTGGCTGAAGAAT GAAGAGGTGATCGATCCTGTGGAAG 637 

Qy 629 ACCCCAATGTATACATCACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTG 688 

III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



638 ACCGAAATTTTT ACATCAC C ATT GAT CACAAC CT GAT CAT CAAGCAAGC CC GGCTTT CCG 697 

689 AC ACGGCCAACT ACACCT GCGT GGC CAAGAAC AT CGT GGC AC GTCGCCGCAGC GC CT C C G 748 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II 

698 AC ACGGCT AACT ACAC CT GT GTT GC CAAAAACATT GT GGCCAAAAGGAAAAGCACGAC AG 757 

749 CTGCTGTCATCGTCTACGTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCA 808 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
758 CAACT GT GATT GT CT AT GT GAAT GGAGGCT GGT CT AC CT GGAC CGAGT GGT C AGCGT GCA 817 

809 GCGCCAGCTGTGGGCGCGGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTC 868 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 
818 ACAGC CGCT GT GGGAGAGGCTT CCAGAAGC GC ACAAGGAC CT GCACTAACC CT GC CCCAC 877 

869 TCAACGGGGGCGCTTTCTGTGAGGGGCAGAATGTCCAGAAAACAGCCTGCGCCACCCTGT 928 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I III III II I II I I I I 
878 TCAATGGGGGGGCCTTCTGCGAGGGGCAAAATGTTCAGAAAATAGCTTGCACCACCCTGT 937 

929 GCCCAGTAGACGGCAGCTGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCA 988 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

938 GT CCAGTGGAT GGCAAAT GGACGT CCT GGAGCAAGT GGT C CACTT GT GGCACAGAGT GT A 997 

989 CCCACTGGCGGAGCCGTGAGTGCTCTGACCCAGCACCCCGCAACGGAGGGGAGGAGTGCC 104 8 

I I I I I I I II I I I I I I I I I I I I I II II I I I I I II I I I I I I 

998 CCCACTGGCGCCGGAGGGAGTGCACAGCTCCGGCCCCGAAGAATGGAGGCAAGGACTGTG 1057 

1049 AGGGCACT GACCT GGACAC C CGCAACT GTACCAGTGACCT CT GT GT AC ACAGT GCT T CT G 1108 

I I I I I I I I I I I II I I I I II I I I I I III III III 

1058 AGGGACTGGTGCTGCAGTCTAAGAACTGCACTGATGGGCTCTGCATGCAGGCTGCACCTG 1117 

1109 GCCCTGAGGACGTGGCCCTCTATGTGGG CCTCATCGCCGTGGCCGTCTGCCTGGTCC 1165 

I I II II II II I I I I I I I I I I I I I I II III II I I I I I I I 

1118 ACTCGGATGATGTTGCTCTCTACGTGGGGATTGTCATTGCTGTGATTGTGTGCCTGGCTA 1177 



1166 TGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATG 

I I I I I I I II I I I I I I I I III I I I I I I I I I I I 

v 1178 TTT CT GT GGTT GTGGCCCT GTTT GT CTATC GCAAGAACC ACCGT GACTTT GAGT CAGAT A 

1226 TGGCTGACTCGTCCATTCTCACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAG 

I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II 

1238 TTATCGACTCATCGGCGCTAAATGGGGGATTTCAGCCTGTTAACATCAAGGCTGCAAGAC 



1225 



1237 



1285 



1297 



1345 



1286 CAGACAACCCCCATCTGCTCACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACC 

I I I I II I I II I I I I I I I I I I I I III III 

1298 AAGAC CTCTTGGCAGTGCCACCAGACCTCACTTCTGCTGCAGCCATGTACA 1348 

1346 AGGGCAGTCTCTGTCCCCGGCAGGATG GGCCCAGCCCCAAGTTCCAGCTCACCAA 1400 

III I I I I I I I I I I I I I I I I I I I I III I I I I I 

1349 GGGGGCCTGTGTATGCCTTGCATGATGTCTCTGATAAAATCCCAATGACCAATTCTCCGA 1408 

1401 T GGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACACTGCACCACAGCTCTC 1456 

I I I I I I I I I I II I I I I I III 

1409 TCCTGGAC C CACT GC CCAAT CT GAAGAT T AAAGT TT ATAACAC CT CT GGAGC AGT CAC C C 1468 



1457 



1498 



CCACCT CT GAGGC C GAGGAGTT CGTCTCCCGCCTCTC CACCC 

II III I I I I I I I I I I I I I I I I I 

1469 CC CAGGAT GAACTCT CT GACTT CT CCT CCAAGCT GT C CC CACAGATT AC CCAGT CT CT GT 1528 



Qy 1499 AGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCA 1534 

I I I I I I II I I I I I I I I I 

Db 1529 TGGAGAAT GAGACT CT GAACGT GAAGAACCAAAGCCT TGC ACGGCAAAC AGACC CAT CCT 1588 

Qy 1535 ACATGACCTATGGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTA 1594 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1589 GCACTGCATTTGGGACCTTCAACTCGTTAGGGGGCCACCTAGTAATTCCTAATTCAGGAG 164 8 

Qy 1595 TCAGCCTCCTCATCCCCCCAGAT GCCATACCCCGAGGGAAGAT CTATGAGAT CT ACCT CA 1654 

I I I I I I I I I I I I III II I I I I I I I I I 11111111111 II 
Db 1649 TGAGCTTGCTGAT CCC AGC AGGG GCT GTT CCCCAAGGAAGAGT CT AT GAAAT GT AT GT GA 1708 

Qy 1655 CGCTGCACAAGCCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTC 1714 

I I I I I I I I I I I I I II I II III I I I I I I I I I I I I I I I I 

Db 1709 CAGTCCACAGGAAGGAGGGCAT GAGACCACCTGTAGAAGACAGCCAGACGCT GCT GACAC 1768 

Qy 1715 CCATCGTTAGCTGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGG 1774 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1769 CAGTGGT GAGCT GT GGC CCACCAGGAGC GCT GCT GACCC GACCCGTT GT GCT GACCAT GC 1828 

Qy 1775 ACCACTGTGGGGAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCG 1834 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I III I II 

Db 1829 ACC ACT GT GCT GAGC CCAACAT GGAT GACT GGCAGAT CC AGCT CAAGC AC C AGGCAGGC C 1888 

Qy 1835 AGGGCAGCT GGGAGGAT GT GCT GC AC CT GGGC GAGGAGGC GC C CT CC CAC CT CT ACT ACT 1894 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1889 AGGGACCAT GGGAGGAT GT AGTGGT GGT CGGGGAGGAAAACT T CACCACT CCAT GCT AC A 194 8 

Qy 1895 GCCAGCTGGAGGCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGG 1954 

I I I I I I I I I I I I I I I I I I I I I I I I II II I III Ml 

Db 1949 TCCAGCTGGACCCAGAGGCCTGTCATATCCTGACGGAGACCCTCAGCACGTACGCCTTGG 2008 

Qy 1955 TGGGAGAGGCCCTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGG 2014 

Mill I I I II I I I I I I II I I I I I I I I M M I I I I I II 

Db 2009 TGGGACAAT CCAT CAC CAAAGCAGCAGC CAAACGT CTCAAAT T GGC CAT CTTT GGAC CAC 2068 

Qy 2015 TGGCCT GCAC CT CCCT CGAGT ACAACAT C C GGGT CT ACT GCCT GCAT GACAC CC AC GAT G 2074 

II II II I I I I II I I II I II II II I I M I I I I I I I I I I II I I I I II MM 

Db 2069 TGT CCT GTT CCT CACT GGAGT ACAGCAT C CGCGT CT ACT GCCT CGAT GACAC AC AGGAT G 2128 

Qy 2075 CACTCAAGGAGGTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCAC 2134 

I II M I I.I I M I I I II I I II I I I I I I I I I I I II I I I I I I II II 
Db 2129 CC CTGAAGGAGGT CCT C CAGCT T GAGC GGCAGATGGGTGGGC AGCT GTT GGAGGAAC C C A 2188 

Qy 2135 GGGTCCTGC ACTT CAAGGACAGTT ACCACAACCT GCGCCT AT C CAT C CAC GAT GT GC C C A 2194 

I M I II II I I III II I I I I I I II I I I I I II I II I I I I I II 
Db 2189 AAACTTT GC AT T T T AAGGGAAGT AC CC ACAACCT GCGCTT AT C CATTCAT GAC AT T GC C C 224 8 

Qy 2195 GCT CC CT GT GGAAGAGT AAGCT CCT T GT CAGCT ACC AGGAGAT CCCCT T TT AT C AC AT CT 2254 

I I I I I I II I II I I I I II I I I I I I II I II I I I I I I I II I I II I I II 
Db 2249 ACT CT CT CT GGAAGAGCAAACT GC C GGCTAAAT ACCAGGAGATT C CTTT TT AC C AC AT CT 2308 

Qy 2255 GGAATGGCACGCAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCA 2314 

I II I I I I I I I I I II I I I I II I II M I I I I I I I II I I I I I I I I I I I 

Db 2309 GGAGT GGGT GCCAGAGGAACT T GC ACT GCACCTT CAC GCT GGAAC GATT CAGT CT CAAT A 2368 



Qy 2315 CTAGTGACCTGGCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCA 2374 

I II II I I I I I I I II II III II I I II II II II II I I I I I I I I I 

Db 2369 CCCTGGAGCTCGTCTGCAAACTCTGTGTGCGGCAAGTCGAAGGAGAAGGGCAGATCTTCC 2428 

Qy 2375 GCATCAACTT CAACAT CACCAAGGACACAAGGT TT GCT GAGCT GCT GGCT CT GGAGAGT G 2434 

I I I II I I I I I II II III I I I I I I 

Db 2429 AGCT GAACT GCT CAGTATCAGAGGAACC CACT GGCAT T GAT T AT CC C AT C AT GGAT T C AG 24 88 

Qy 2435 AAGCGGGGGTCCCAGCCCTGGTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGC 24 94 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 2489 CAGGCAGCATCACAACGATAGTTGGGCCCAACGCTTTCAGCATCCCCCTCCCAATAAGGC 2548 

Qy 2495 AGAAGATAATTTCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGG 2554 

I I I I I I MINIMI I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2549 AGAAGCT CTGC AGC AGC CTGGAT GCAC C CCAGAC C C GGGGC CAT GACT GGAGGATGCT GG 2608 

Qy 2555 CCCAGAAACT CC AC CT GGACAGCCAT CT CAGCTT CT TT GC CTC CAAGCCCAGC CCCACAG 2614 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2609 CCCACAAGCT GAAAT T GGACAGGT AC CTAAAT TAT T TT GCT ACGAAGT CGAGT C C C ACT G 2668 

Qy 2615 CCAT GAT CCT CAAC CTGT GGGAGGCGC GGCACT T C C CCAAC GGCAACCTCAGCCAGCT GG 2674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2669 GGGT GAT C CT GGAT CT CT GGGAAGCCCAGAATT T C C CT GAT GGCAACCTGAGC ATGCT GG 2728 

Qy 2675 CTGCAGCAGT GGCT GGACTGGGCCAGCCAGAC GCT GGCCTCTTCACAGTGTCGGAGGCTG 2734 

I I I I I III I I I I I I I I II II II I I I I I 

Db 2729 CAGCAGT GCT GGAAGAAATGGGACGACATGAAACCGTT GTT TCT TT GGCAGCAGAAGGAA 2788 

Qy 2735 AGTGCTGAGGCCGGC 274 9 

I I I I I I I I I I 

Db 2789 ATTACTGATGCAGCC 2803 



Search completed: March 6, 2005, 05:24:52 
Job time : 11708.8 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



March 5, 2005, 14:42:51 ; Search time 1401 Seconds 

(without alignments) 
11628.216 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 4390206 seqs, 2959870667 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000' 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



8780412 



Database : 



N_Geneseq_16Dec04 : 



1 
2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 



geneseqnl980s : * 
geneseqnl990s : * 
geneseqn2000s : * 
geneseqn2001as : * 
geneseqn2001bs : * 
geneseqn2002as : * 
geneseqn2002bs : * 
geneseqn2003as : * 
geneseqn2003bs : * 
geneseqn2003cs : * 
geneseqn2003ds : * 
geneseqn2004as : * 
geneseqn2004bs : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
ABK37922 

ID ABK37922 standard; cDNA; 2752 BP. 
XX 

AC ABK37922; 
XX 

DT 21-MAY-2002 (first entry) 
XX 

DE cDNA encoding Human protein N0V1 . 
XX 

KW Human; NOVX; ss; gene; cardiomyopathy; atherosclerosis; diabetes; 



KW cell signal processing disorder; metabolic disorder; obesity; infection; 

KW anorexia; cancer-associated cachexia; cancer; neurodegenerative disorder; 

KW Alzheimer's disease; Parkinson's disease; immune disorder; 

KW haematopoietic disorders; dyslipidaemia; pain; asthma; hypertension; 

KW osteoporosis; Crohn's disease; multiple sclerosis; angina pectoris; 

KW myocardial infarction; ulcer; allergy; benign prostatic hypertrophy; 

KW psychosis; neurological disorder; anxiety; schizophrenia; 

KW manic depression; dementia; dyskinesia; Huntington's disease; 

KW Gilles de la Tourette ' s syndrome; gene therapy. 

XX 

OS Homo sapiens. 
XX 

PN WO200210216-A2. 
XX 

PD 07-FEB-2002. 
XX 

PF 30-JUL-2001; 2001WO-US024225 . 
XX 

PR 28-JUL-2000; 2000US-0221409P . 

PR 04-AUG-2000; 2000US-0222840P . 

PR 04-AUG-2000; 2000US-0223752P . 

PR 04-AUG-2000; 2000US-0223762P . 

PR 04-AUG-2000; 2000US-0223769P . 

PR 04-AUG-2000; 2000US-0223770P . 

PR 14-AUG-2000; 2000US-0225146P . 

PR 15-AUG-2000; 2000US-0225392P . 

PR 15-AUG-2000; 2000US-0225470P . 

PR 16-AUG-2000; 2000US-0225697P . 

PR 01-FEB-2001; 2001US-0263662P . 

PR 05-APR-2001; 2001US-0281645P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Mezes P, Mishra V, Burgess C, Casman S, Grosse WM; 

PI Alsobrook JP, Lepley DM, Gerlach VL, Macdougall JR, Smithson G; 
XX 

DR WPI; 2002-180074/23. 

DR P-PSDB; AAU85403. 
XX 

PT New isolated cytoplasmic, nuclear, membrane bound, or secreted 

PT polypeptide, useful for treating cardiomyopathy, atherosclerosis, 

PT infections, cancer, neurodegenerative, metabolic, hematopoietic and 

PT immune disorders. 
XX 

PS Claim 9; Page 9-10; 213pp; English. 
XX 

CC The invention relates to an isolated cytoplasmic, nuclear, membrane 

CC bound, or secreted polypeptide (NOVX, x= 1-14) their variants or mature 

CC form. Also included are the nucleic acids encoding the NOVX proteins, a 

CC vector comprising the nucleic acid, a cell comprising the vector, an anti 

CC -NOVX antibody and modulators of NOVX. NOVX, the nucleic acid and the 

CC antibody are useful for treating or preventing a NOVX-associated 

CC disorder, where the disorder is selected from cardiomyopathy, 

CC atherosclerosis, diabetes, a disorder related to cell signal processing 

CC and metabolic pathway modulation, metabolic disorders, obesity, 

CC infectious disease, anorexia, cancer-associated cachexia, cancer, 

CC neurodegenerative disorders, Alzheimer's disease, Parkinson's disease, 



CC immune disorders , haematopoietic disorders, and the various 

CC dyslipidaemias, metabolic disturbances associated with obesity, the 

CC metabolic syndrome X and wasting disorders associated with chronic 

CC diseases, bacterial, fungal, protozoal and viral infections, pain, 

CC bulimia, asthma, hypertension, urinary retention, osteoporosis, Crohn 1 s 

CC disease, multiple sclerosis, Albright Hereditary Osteodystrophy, angina 

CC pectoris, myocardial infarction, ulcer, allergy, benign prostatic 

CC hypertrophy, and psychotic and neurological disorders, including anxiety, 

CC schizophrenia, manic depression, delirium, dementia, and dyskinesias, 

CC such as Huntington's disease and Gilles de la Tourette 1 s syndrome. The 

CC nucleic acid is useful in gene therapy. The present sequence encodes a 

CC NOVX protein 

XX 

SQ Sequence 2752 BP; 505 A; 937 C; 829 G; 481 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2752; DB 6; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
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CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 


60 






i i i i i i i i i I ■ I I I I I I I I I I I I I I I I 1 1 t 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 




Db 
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CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 


60 


Qy 


61 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


-ion 

120 






i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


61 


GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 


120 


Qy 


121 


CAGCAGAGTGCCACCGTGGCGAACCCAGTGCCTGGTGCCAACCCGGACCTGC1 1 COCCAU 








i i i i i i i i \ i i i i i i i i i i i i i i i i i i i i i i i t i i i i \ t j i t \ i i i i i i i i i i i t i i i i i 
1 II 1 II II I 1 1 I II II 1 1 II II II II 1 II II 1 1 II 1 II 1 1 1 M 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


121 


CAGCAGAGT GCCACCGT GGCCAACCCAGT GCCT GGT GCCAAC CC GGAC CT GCT T CCCCAC 


180 
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i ft i 




£, 1 \J 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


TT C CTGGT GGAGC CCGAGGAT GT GT ACAT CGT CAAGAACAAGCC AGT G CT GCTT GT GT GC 


240 


Qy 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 


300 


Qy 


301 


GACCAC GTGATCGAGCGCAGCACAGAC GGGAGCAGT GGGCT GCCCAC CAT GGAGGT CC GC 


360 






1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II 1 1 




Db 


301 


GACCAC GTGAT C GAGCGCAGCACAGAC GGGAGCAGT GGGCT GCCCAC CAT GGAGGT CC GC 


360 


Qy 


361 


ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAATACT GGT GC CAG 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


ATTAAT GT CT CAAGGC AGC AGGTC GAGAAGGT GTT CGGGCT GGAGGAATACT GGT GC CAG 


420 


Qy 


421 


TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 


480 


Qy 


481 


AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


481 


AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 


540 


Qy 


541 


ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 


600 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

601 AAC GAGGAC CT GGT GGACCC GT C C CT GGACCCCAAT GT AT AC AT C AC GCGGGAGC AC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

601 AACGAGGACCTGGT GGACC CGT CC CT GGACCCCAAT GT AT AC AT CAC GC GGGAGC ACAGC 660 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 GTCCAGAAAACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGGAGC 960 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

1021 GC ACCC CGCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACAC CC GCAACT GT AC C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 GCAC CCCGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGACAC CC GCAACT GT AC C 1080 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

1201 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT C CAT T CT C ACCT CAGGCTT CCAG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 AAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT CGT C CAT T CT CACCT CAGGCTT C C AG 1260 

1261 CC CGT C AGCAT CAAGCCCAGCAAAGCAGACAAC C CC C AT CT GCT CAC CAT C C AGCC GGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 CCC GTCAGCAT CAAGCC CAGCAAAGCAGACAACC C CCAT CT GCT CAC CAT C CAGCC GGAC 1320 

1321 CT C AGCAC CAC CAC CAC CAC CT AC CAGGGC AGT CT CT GT CCC C GGCAGGAT GGGC CC AGC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 CTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCCAGC 1380 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 



Qy 1441 CT GC AC C ACAGCT CT CC CAC CTCT GAGGC CGAGGAGTTC GT CTCC C GCCT CT C CAC CCAG 150D 

I I I t I i I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I II I I I I I I I 
Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACT ACT T CC GCT CCCTGCCCC GAGGCAC C AGCAACAT GAC CT AT GGGAC CT T CAACT TC 1560 

I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 AACT ACT T CC GCT C C CT GCC CCGAGGCAC C AGCAACAT GAC CT AT GGGAC CT T CAACT T C 1560 

Qy 1561 CT CGGGGGCC GGCT GAT GAT C C CT AATACAGGT AT CAGC CT C CT CAT C C C C C CAGAT GCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

Qy 1621 AT ACCC CGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GCACAAGC C GGAAGAC GT GAGG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AT ACCC CGAGGGAAGAT CT AT GAGAT CTACCTCACGCTGCACAAGCCGGAAGACGTGAGG 1680 

Qy 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

Qy 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

Qy 1801 AGCT GGAGC CTGC GCCT CAAAAAGCAGT C GT GC GAGGGC AGCT GGGAGGAT GT GCT GCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 
Db 1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

Qy 1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTGGGCGAGGAGGC GCC CTCCCACCTCTACTACTGCCAGCTGGAGGCCAGT GCCT GCTAC 1920 

Qy 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

Qy 1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GCCAAGCGCCTCAAGCTGCfTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

Qy 2041 ATCCGGGTCTACTGCCTGCAT GACACCCACGAT GCACT CAAGGAGGTGGTGCAGCTGGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 AT CCGGGT CT ACT GC CT GCATGAC ACCC ACGAT GCACT CAAGGAGGT GGT GCAGCT GGAG 2100 

Qy 2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT C CT GCACT T CAAGGACAGTTAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 2101 AAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT C CT GCACT T CAAGGACAGT TAC 2160 

Qy 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAGCTCCTT 2220 

Qy 2221 GT CAGCTAC C AGGAGAT CC CCTTTT ATCACATCT GGAAT GGCACGCAGC GGT ACT T GC AC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GT CAGCT ACCAGGAGAT C C CCTTTT AT CAC AT CT GGAAT GGC AC GCAGC GGT ACTT GCAC 2280 



Qy 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 234 0 

Qy 2341 GTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACCAAGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GT GT GGCAGGT GGAGGGCGACGGGC AGAGCTTC AGCAT CAACTT CAACAT CACCAAGGAC 2400 

Qy 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

Qy 2461 CC CAGT GCCTT CAAGAT CCCCTTCCT CATT CGGC AGAAGATAATTT C C AGC CT GGACC CA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 CC C AGT GCCTT CAAGAT C C CCTTC CT CATT CGGCAGAAGATAATTT CC AGC CT GGACC C A 2520 

Qy 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

Qy 2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGGGAGGCG 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CT CAGCTT CT TT GC CT CCAAGC C CAGC CCCACAGCCAT GAT C CT CAAC CT GT GGGAGGC G 2640 

Qy 2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2641 CGGCACTT CCC CAAC GGCAAC CT CAGC CAGCT GGCT GCAGCAGT GGCT GGACT GGGC CAG 2700 

Qy 2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 CCAGACGCT GGC CT CTT CACAGT GT C GGAGGCT GAGT GCT GAGGC CGGC CAG 2752 



RESULT 2 
ADH71617 

ID ADH71617 standard; DNA; 2752 BP. 
XX 

AC ADH71617; 
XX 

DT 25-MAR-2004 (first entry) 
XX 



DE Human gene of the invention NOV21e SEQ ID NO: 513. 
XX 

KW ds; gene; human; cytostatic; immunomodulator; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 

PN WO2003102155-A2. 
XX 

PD ll-DEC-2003. 
XX 

PF 03-JUN-2003; 2003WO-US017430 . 
XX 
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-2002; 


PR 


15 


-AUG- 


•2002; 



2002US-0385120P. 
2002US-0385784P. 
2002US-0386041P. 
2002US-0386047P. 
2002US-0386376P. 
2002US-0386453P. 
2002US-0386864P. 
2002US-0387016P. 
2002US-0386796P. 
2002US-0386816P. 
2002US-0386931P. 
2002US-0386942P. 
2002US-0386971P. 
2002US-0387262P. 
2002US-0296960P. 
2002US-0387400P. 
2002US-0387535P. 
2002US-0387610P. 
2002US-0387625P. 
2002US-0387634P. 
2002US-0387668P. 
2002US-0387696P. 
2002US-0387702P. 
2002US-0387836P. 
2002US-0387859P. 
2002US-0387933P. 
2002US-0387934P. 
2002US-0387960P. 
2002US-0388022P. 
2002US-0388096P. 
2002US-0389123P. 
2002US-0389118P. 
2002US-0389120P. 
2002US-0389144P. 
2002US-0389146P. 
2002US-0389729P. 
2002US-0389742P. 
2002US-0389884P. 
2002US-0390006P. 
2002US-0390209P. 
2002US-0390763P. 
2002US-0396706P. 
2002US-0401628P. 
2002US-0402156P. 
2002US-0402256P. 
2002US-0402389P. 
2002US-0402786P. 
2002US-0402816P. 
2002US-0402821P. 
2002US-0402832P. 
2002US-0403448P. 
2002US-0403459P. 
2002US-0403531P. 
2002US-0403532P. 
2002US-0403563P. 
2002US-0406317P. 
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PR 26-AUG-2002; 2002US-0406182P . 

PR 26-AUG-2002; 2002US-0406355P . 

PR 27-AUG-2002; 2002US-0406240P . 

PR 12-SEP-2002; 2002US-0410084P . 

PR 20-SEP-2002; 2002US-0412528P . 

PR 23-SEP-2002; 2002US-0412731P . 

PR 30-SEP-2002; 2002US-0414801P . 

PR 30-SEP-2002; 2002US-0414839P . 

PR 30-SEP-2002; 2002US-0414840P . 

PR 30-SEP-2002; 2002US-0414954P. 

PR 09-OCT-2002; 2002US-0417186P . 

PR 09-OCT-2002; 2002US-04 17406P . 

PR 23-OCT-2002; 2002US-0420639P . 

PR 28-OCT-2002; 2002US-0421156P . 

PR 31-OCT-2002; 2002US-0422690P . 

PR 01-NOV-2002; 2002US-0423130P . 

PR 05-NOV-2002; 2002US-00423798 . 

PR 05-NOV-2002; 2002US-0423798P . 

PR 12-NOV-2002; 2002US-0425453P . 
XX 

PA (CURA-) CURAGEN CORP, 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Maiyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71618. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 513; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC . polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer ! s disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 



SQ Sequence 2752 BP; 505 A; 937 C; 829 G; 481 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2752; DB 12; Length 2752; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2752; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 

Db 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db .61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CAGCAGAGT GCCACC GT GGC CAACC CAGTGCCT GGT GC CAACC C GGACCT G CTT C CC C AC 180 

Qy 181 TT CCT GGT GGAGCCC GAGGAT GT GT ACAT CGTCAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 181 TT CCT GGT GGAGCCC GAGGAT GT GT ACATCGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

Qy 301 GAC C ACGT GAT C GAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC CAC CAT GGAGGT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GAC C ACGT GAT CGAGCGCAGCACAGAC GGGAGCAGT GGGCT GCC CAC CAT GGAGGT CC GC 360 

Qy 361 ATTAATGT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AT TAATGT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGTGCC AG 420 

Qy 421 T GC GT GGCAT GGAGCT C CT C GGGC AC CACCAAGAGT C AGAAGGC CT ACAT CCGCAT AGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 T GCGT GGCAT GGAGCTC CTCGGGCAC CACCAAGAGT CAGAAGGC CT ACAT CCGCAT AGC C 480 

Qy 481 AGATT GCGCAAGAACTT CGAGC AGGAGCCGCTGGC CAAGGAGGT GT C CCT GGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AGATT GCGCAAGAACTT C GAGCAGGAGCCGCT GGC CAAGGAGGT GT C CCT GGAGCAGGGC 540 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

Qy 601 AAC GAGGACCT GGT GGAC C CGT CC CT GGACC CCAAT GT AT ACAT C AC GC GGGAGC AC AGC 660 

I I I I I I I I I I I I M l I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AAC GAGGACCT GGT GGACCC GT C C CT GGACCCCAAT GT AT ACAT CACGCGGGAGC AC AGC 660 

Qy 661 CT GGT GGT GCGACAGGC CCGC CTT GCT GACACGGC CAACT ACAC CTGC GT GGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CT GGT GGT GCGACAGGC CCGC CTT GCT GAC ACGGC CAACT ACAC CT GC GT GGC CAAGAAC 720 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I 
Db 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 



Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

Qy 901 GT CCAGAAAACAGC CT GC GC CAC CCTGT GCCCAGT AGAC GGCAGCT GGAGC C C GT GGAGC 960 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

Db 901 GT CCAGAAAACAGCCT GC GCCAC CCTGT GCCCAGT AGAC GGCAGCT GGAGC CC GT GGAGC 960 

Qy 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGACCCA 1020 

Qy 1021 GCACC CCGCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGACACCCGCAACT GT AC C 1080 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 GCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACT GAC CT GGACACCCGCAACT GT AC C 1080 

Qy 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGCCTC 1140 

Qy 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGCCGG 1200 

Qy 1201 AAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT CGTC CATT CT CAC CT CAGGCT TCCAG 1260 

I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 AAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT CGT C CATT CT CAC CT CAGGCT T CCAG 1260 

Qy 1261 CCCGT CAGC AT CAAGCCC AGCAAAGCAGACAACCCC CAT CTGCT CAC CAT C CAGC CGGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 CCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCCC CAT CTGCT CAC CAT C CAGCCGGAC 1320 

Qy 1321 CT CAGCACCACCACCAC CACCTAC CAGGGCAGTCT CT GT CCC C GGCAGGAT GGGC CCAGC 1380 

I I I I I I II" I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 CTCAGCACCACCAC CAC CACCTAC C AGGGC AGT CT CT GT C CC C GGCAGGAT GGGC CCAGC 1380 

Qy 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCACACA 1440 

Qy 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACCCAG 1500 

Qy 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1501 AACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAACTTC 1560 

Qy 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 CTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGATGCC 1620 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db" 

Qy 

Db 

Qy 



1621 ATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGG 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I ! I I I I I I 

1621 ATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGTGAGG 1680 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 1740 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 TTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCTGGC 174 0 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I 

1741 GTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCTGAC 1800 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 AGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGGATGTGCTGCAC 1860 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 CTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCCTGCTAC 1920 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I U 

1921 GTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTGGCTGCC 1980 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I I I I 

1981 GCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAGTACAAC 2040 

2041 AT C CGGGTCTACTGCCT GC AT GACAC CCAC GAT G CACTCAAGGAGGT GGT GCAGCT GGAG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 AT C CGGGT CT ACT GCCT GC AT GACAC C CACGAT GCACT CAAGGAGGTGGT GCAGCT GGAG 2100 

2101 AAGCAGCT GGGGGGAC AGCT GAT C C AGGAGC CAC GGGT C CTGCACT T CAAGGACAGT T AC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2101 AAGCAGCT GGGGGGACAGCT GAT C C AGGAGC CAC GGGT C CTGCACT T CAAGGACAGT T AC 2160 

2161 CACAACCTGCGC CT AT CCAT CCAC GAT GTGC CCAGCT CC CTGT GGAAGAGTAAGCT C CT T 2220 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 CACAAC CT GCGCCT ATCCAT CCAC GAT GT GC CCAGCT CC CTGT GGAAGAGTAAGCT C CT T 2220 

2221 GT CAGCTACCAGGAGAT CCC CTTTT AT CAC AT CT GGAAT GGC ACGC AGCGGT ACT T GCAC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2221 GT CAGCTACCAGGAGAT C C CCTTTT AT CAC AT CT GGAAT GGCACGC AGCGGT ACTT GCAC 2280 

2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2281 TGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAGCTGTGG 2340 

2341 GT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT C AGC ATCAACT T CAACAT CAC CAAGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2341 GT GTGGCAGGT GGAGGGC GAC GGGCAGAGCTT CAGC ATCAACTTCAACAT C ACCAAGGAC 2400 

2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 2460 

I I I I IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2401 ACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTGGTGGGC 24 60 

2461 CC CAGT GCCTT CAAGAT CCCCTTCCT C ATT C GGC AGAAGATAATT T CCAGC CT GGAC C CA 2520 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I 
2461 CC C AGT GCCTT CAAGAT C C C CTT C CTC ATT C GGCAGAAGATAATTT C C AGC CT GGAC C C A 2520 



2521 



2580 



CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2521 CCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGACAGCCAT 2580 

2581 CT C AGCTTCTT T GCCT C CAAGCC CAGC CCC AC AGC CAT GAT CCT CAAC CT GT GGGAGGC G 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I 
2581 CTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGT GGGAGGC G 2640 

2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTGGGCCAG 2700 

2701 CCAGAC GCT GGC CT CT T CACAGT GT CGGAGGCTGAGT GCT GAGGC C GGC CAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 CCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 
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XX 
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XX 
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XX 

DE Human netrin binding membrane receptor UNC5H-1 DNA sequence #1. 
XX 

KW Netrin binding membrane receptor; receptor; UNC5H-1; gene; ds; human; 

KW nootropic; neuroprotective; cytostatic; antiparkinsonian; 

KW cerebroprotective; cancer; central nervous system; CNS; stroke; 

KW Parkinson's disease; multiple sclerosis; Alzheimer's disease. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2697 
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XX 
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XX 
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XX 



PT Novel human netrin binding membrane receptor polypeptide and 

PT polynucleotides for identifying modulating agents useful in treating 

PT diseases e.g. Parkinson 1 s disease, multiple sclerosis, stroke, 

PT Alzheimer's disease. 

XX 

PS Claim 1; Fig 1; 94pp; English. 
XX 

CC This invention relates to the DNA and protein sequences of a novel 

CC purified human netrin binding membrane receptor, UNC5H-1. The DNA 

CC sequence of the invention is useful as a probe for detecting a nucleic 

CC acid encoding the UNC5H-1 protein in a biological sample. The sequences 

CC of the invention are useful to screen for agents which decrease the 

CC activity of the UNC5H-1 protein. The sequences are also useful for 



CC screening agents which regulate (modulate) the activity of the protein of 

CC the invention. A pharmaceutical composition containing the protein of the 

CC invention or a reagent that modulates the activity of the UNC5H-1 protein 

CC may be useful for treating a UNC5H-1 dysfunction related disease such as 



CC cancer or a central nervous system (CNS) disorders (e.g, Parkinson's 

CC disease, multiple sclerosis, stroke and Alzheimer's disease). Fusion 

CC proteins comprising the UNC5H-1 protein are useful for generating 

CC antibodies and for in various assay systems, and the protein can be used 

CC as a bait protein in a two-hybrid assay or three-hybrid assay. The method 

CC of the invention is useful for detecting a coding sequence for the UNC5H- 

CC 1 protein. The present sequence represents a DNA sequence encoding the 

CC human netrin binding membrane receptor UNC5H-1 protein of the invention 

XX 

SQ Sequence 2697 BP; 503 A; 906 C; 807 G; 481 T; 0 U; 0 Other; 



Query Match 97.7%; Score 2687.4; DB 6; Length 2697; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 2691; Conservative 0; Mismatches 6; Indels 0; Gaps 0; 



Qy 


46 


ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 


105 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 


60 


Qy 


106 


CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 


165 




1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 


120 


Qy 


166 


GACCT GCTT CC C C ACTT CCT GGT GGAGCCCGAGGAT GTGT ACAT C GT CAAGAACAAGCCA 


225 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


GAC CT GCTT C C C CACTT CCT GGT GGAGCCCGAGGAT GTGT AC AT C GT CAAGAACAAGC CA 


180 


Qy 


226 


GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 


285 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 


240 


Qy 


286 


TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 


345 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


241 


TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 


300 


Qy 


346 


AC CAT GGAGGT C C GCATTAAT GT CT CAAGGC AGCAGGT C GAGAAGGT GT T C GGGCT GGAG 


405 






1 III 1 II II II 1 1 1 1 1 1 III 1 1 1 1 1 II 1 1 1 II III 1 1 1 1 II 1 II IJIIIIIILI.IL LI 1 1 




Db 


301 


AC CAT GGAGGT C C GCAT TAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAG 


360 



Qy 



406 GAATACTGGTGCCAGTGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCC 465 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

361 GAAT ACT GGT GC CAGTGC GT GGCAT GGAGCT CCT C GGGC AC C AC CAAGAGT CAGAAGGC C 



466 



421 



526 



481 



586 



541 



646 



601 



706 



661 



766 



721 



826 



781 



886 



841 



946 



901 



T ACAT C CGCAT AGCCAGATT GC GCAAGAACTT C GAGCAGGAGCC GCT GGC CAAGGAGGT G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACATCCGCATAGCCTATTTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTG 

TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
T C C CTGGAGCAGGGCAT C GT GCT GCCCTGCCGTC CACC G GAGGGC AT C C CT CCAGC C GAG 

GT GGAGT GGCTC CGGAAC GAGGAC CT GGT GGAC C CGT C CCT GGAC C CCAAT GT AT ACAT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT GGAGT GGCTC CGGAAC GAGGAC CT GGT GGAC C C GT C C CT GGAC C CCAAT GT AT AC AT C 

ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 

TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 

GTGAAC GGT GGGT GGT CGACGT GGAC CGAGT GGT CCGTCTGCAGCGCCAGCTGT GGGC GC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGAAC GGT GGGT GGT CGACGT GGAC CGAGT GGT CCGTCTGCAGCGCCAGCTGT GGGC GC 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 

T GT GAGGGGCAGAAT GT CCAGAAAACAGCCT GCGCCAC C CT GT GCC C AGT AGAC GGCAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
T GT GAGGGGCAGAAT GT CCAGAAAACAGCCT GC G C C AC C CT GT GC C CAGT GGAC GGCAGC 



420 



525 



480 



58! 



540 



645 



600 



705 



660 



765 



720 



825 



780 



885 



840 



945 



900 



T GGAGC C CGT GGAGCAAGT GGT C GGCCT GT GGGCT GGACT GC AC C CACT GGCGGAGC C GT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
T GGAGC C CGT GGAGCAAGT GGT C GGCCT GT GGGCT GGACT GCACC CACT GGCGGAGCCGT 960 



1006 GAGT GCT CT GACC CAGCACC CCGCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC 1065 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGT GCT CT GACC CAGCACCCCGCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGAC 1020 



961 



1125 



1066 ACC C GCAACT GTACCAGTGACCT CT GT GT ACACAGT GCT T CT GGCCCTGAGGAC GT GGCC 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1021 ACC C GCAACT GT ACC AGT GACCT CT GT GT ACAC ACT GCTT CT GGCC CTGAGGAC GT GGCC 1080 



1126 



1185 



CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1140 

1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCT GGACT CAGATGTGGCTGACTCGTCCATTCTC 1245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CTCGTTTATTGCCGGAAGAAGGAGGGGCT GGACT CAGATGTGGCTGACTCGTCCATTCTC 1200 

1246 AC CT CAGGCTT CCAGCC C GT CAGC AT CAAGC CCAGCAAAGCAGACAACC C C CAT CT GCTC 1305 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1201 ACCTCAGGCTTCCAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTC 1260 

Qy 1306 AC CAT CCAGC C GGACCTCAGC ACCACCAC CAC C ACCT AC C AGGGC AGT CT CTGT CCC CGG 1365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 ACCATCCAGCCGGACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I 

Db 1321 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1380 

Qy 1426 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 1485 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGCGGCCGCCACACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCC 144 0 

Qy 1486 CGCCT CT C CACC C AGAACT ACTT CC GCT CCCT GC C CCGAGGCACCAGCAAC AT GACCT AT 1545 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1500 

Qy 1546 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTC 1605 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGAATCAGCCTCCTC 1560 

Qy 1606 ATCCCCCCAGAT GCCATACCCCGAGGGAAGATCTATGAGATCTACCT CACGCT GCACAAG 1665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 ATCCCCCCAGAT GCCATACCCCGAGGGAAGATCTATGAGATCTACCT CACGCT GCACAAG 1620 

Qy 1666 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1725 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CCGGAAGACGTGAGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1740 

Qy 1786 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1861 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 1980 

Qy 2026 T C C CT C GAGTACAAC AT CC GGGT CT ACT GC CT GC AT GAC ACC C ACGAT GC ACT CAAGGAG 2085 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1981 T C CCT C GAGT ACAACAT C C GGGT CT ACT GC CT GCAT GAC AC CCACGAT GC ACT CAAGGAG 2040 

Qy 2086 GT GGT GCAGCT GGAGAAGC AGCT GGGGGGACAGCT GAT C CAGGAGCCACGGGT C CTGCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GT GGT GCAGCTGGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGT C CTGCAC 2100 



Qy 2146 TTCAAGGAC AGTT AC C ACAAC CT GC GC CT AT CCAT CCAC GAT GT GCCCAGCT C CCT GT GG 2205 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2101 TTCAAGGACAGTT ACCACAAC CT GC GC CT AT CCAT CCAC GAT GT GCCCAGCT C CCT GT GG 2160 

Qy 2206 AAGAGTAAGCTCCTT GT CAGCT ACC AGGAGAT C CCCTTT TAT CAC AT CT GGAAT GGCAC G 2265 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AAGAGT AAGCT CCTT GT CAGCT AC CAGGAGAT C CCCTTTT AT CACAT CT GGAAT GGCAC G 2220 

Qy 2266 CAGCGGT ACT T GCACT GCACCTT CAC C CT GGAGCGT GT C AGC CC CAGC ACT AGT GAC CT G 2325 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2221 CAGCGGTACTTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTG 2280 

Qy 2326 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2385 

I I I I II I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2281 GCCTGCAAGCTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTC 2340 

Qy 2386 AACAT C ACCAAGGACACAAGGTTT GCT GAGCT GCT GGCT CT GGAGAGT GAAGC GGGGGT C 2445 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2341 AACATCACCAAGGACACAAGGTTTGCT GAGCTGCT GGCT CTGGAGAGTGAAGCGGGGGTC 2400 

Qy 2446 C CAGCC CTGGTGGGCC C CAGT GCCTT CAAGAT CCC CTT C CT CATT CGGCAGAAGATAATT 2505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2401 C CAGCC CTGGTGGGC C C CAGT GC CT T CAAGAT CCC CTT C CT CATT CGGCAGAAGAT AAT T 2460 

Qy 2506 T CCAGC CTGGAC C CAC C CT GT AGGC GGGGT GC C GACTGGCGGACT CT GGC C CAGAAACT C 2565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 
Db 2461 TCCAGCCTGGACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTC 2520 

Qy 2566 CAC CTGGACAGCC AT CTCAGCT T CTTT GCCT CCAAGCCCAGC CC CAC AGC CAT GAT C CT C 2625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 CACCTGGACAGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTC 2580 

Qy 2626 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTG 2685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AACCTGTGGGAGGCGCGGCACTTCCCCAACGGCAACCT CAGC CAGCT GGCT GCAGCAGTG 2640 

Qy 2686 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GCTGGACTGGGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGA 2 697 
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CC screening. The present nucleic acid sequence is that of the human UNC5- 

CC like NOV1 gene located on chromosome 13. This sequence encodes the human 
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Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGT GC CACCGT GGCCAACCCAGT GCCT GGT GCCAAC C C GGACCT GCTT C C C CAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 162 CAGCAGAGT GCCAC C GT GGC CAAC C CAGT GC CT GGT GC CAAC C C GGACCT GCTT C CCC AC 221 



Qy 181 TTC CTGGT GGAGC CC GAGGAT GT GTACAT C GT CAAGAAC AAGCC AGT GCT GCTT GT GT GC 240 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db - 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GAC CACGTGATCGAGCGCAGCAC AGACGGGAGCAGT GGGCT GCC CAC CAT GGAGGT C C GC 360 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml II I I I II I I I I II I I 
Db 342 GAC CACGTGATCGAGC GCAGCAC AGACGGGAGCAGT GGT GAGCC GACC AT GGAGGT C C GC 401 

Qy 361 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT CGGGCT GGAGGAAT ACT GGT G C C AG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I hi I I I I I I I I I I J I I I I I I I I 

Db 402 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GC C AG 4 61 

Qy , 421 T GCGTGGCAT GGAGCT CCT CGGGCACC ACCAAGAGT CAGAAGGC CTACAT C CGCAT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 462 T GC GTGGCAT GGAGCT CCT CGGGCAC CACCAAGAGT CAGAAGGC CTACAT C C GCAT AGCC 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AACGAGGACCT GGTGGACCCGT CC CT GGAC CC CAAT GT AT AC AT C ACGCGGGAGC AC AGC 660 

I I II I I I I I I I I I I M I I I I I I ! I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 642 AAC GAGGAC CT GGT GGACCCGT CC CT GGAC CC CAAT GT AT AC AT C ACGC GGGAGC AC AGC 701 

i 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
Db 7 02 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 7 61 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTG7UVCGGTGGGTGG 821 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
Db 822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

Qy 841 AGCC GGAGCT GCAC CAAC C C GGC GC CT CT CAAC GG GGGC GCT TT CTGT GAGGG GC AGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

Qy 901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 957 

Mill I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I M 

Db 942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I 
Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGC C AGGGCACT GAC CT GGACAC C C GCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1062 C CAGCACCCC GCAACGGAGGGGAGGAGT GC CAGGGC ACTGAC CT GGACAC CCGCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GT C CAT T CT CACCT C AGGCTT C 1257 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1242 C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GTC C ATTCT CAC CT C AGGCTT C 1301 

1258 CAGCCCGTCAGCATCAAGCC CAGCAAAGCAGACAACCC C CAT CT GCT CAC CAT C CAGC C G 1317 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1302 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCAT CTGCTCACCAT CCAGCCG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1362 GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 C AGAACT ACTTCCGCT CCCT GC CC CGAGGCAC C AGCAACAT GACCT AT GGGAC CTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1539 CAGAACT ACTTCCGCT CCCT GCCC CGAGGCAC CAGCAACAT GACCT AT GGGAC CTT CAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GCCATACCCCGAGGGAAGATCTATGAGATCTACCT CACGCT GCACAAGCCGGAAGACGTG 1677 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCATAC CCCGAGGGAAGAT CTAT GAGAT CT AC CT CACGCT GCACAAGCCGGAAGACGT G 1718 



1659 



1737 



1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I LI I I I I 

1839 GACAGCT GGAGCCTGCGCCT CAAAAAGC AGTC GTGC GAGGGC AGCTGGGAGCAGGAT GT G 1898 
1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 19,58 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACATCCGGGT CTACTGCCTGCATGACACCCACGAT GCACTCAAGGAGGT GGT GCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

2079 TACAACATCCGGGT CTACTGCCTGCATGACACCCACGAT GCACTCAAGGAGGT GGT GCAG 2138 

2095 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2198 

2155 AGTT ACCACAACCT GCGCCT AT CCAT CCACGAT GT GCCCAGCTCCCT GT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2199 AGTTACCACAACCTGCGCCTATCCATCCACGAT GT GCCCAGCTCCCTGT GGAAGAGTAAG 2258 

2215 CT C CT T GT CAGCT ACCAGGAGAT C C C CT TTT AT CACAT CT GGAAT GGCAC GCAGC GGT AC 2274 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2259 CT CCTT GT CAGCT ACCAGGAGAT C CC CT TTT AT CACAT CT GGAAT GGCAC GCAGC GGT AC 2318 

2275 TT GC ACT GCACCTT CACC CT GGAGCGT GT CAGC C C CAGC ACT AGT GACCT GGC CT GCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2319 TT GCACTGCAC CTT CAC C CT GGAGCGT GT CAGC C C CAGC ACT AGT GACCT GGCCT GCAAG 2378 

2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2439 AAGGACACAAGGTTT GCT GAGCT GCT GGCT CTGGAGAGT GAAGC GGGGGT C C CAGCC CT G 2498 

2455 GT GGGC C CCAGT GCCTT CAAGAT C C C CTT C CTCATT CGGCAGAAGAT AATT T CCAGC CTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2499 GT GGGC C C CAGT GCCTT CAAGAT C CCCTT C CTCATT CGGCAGAAGAT AAT T T CC AGCCT G 2558 

2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

2575 AGC CAT CT CAGCT T CTT T GC CT C CAAGC CCAGC C C CAC AGC CAT GAT CCT C AAC CT GT GG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

2695 GGCCAGCCAGAC GCT GGCCT CTT CACAGTGTCGGAGGCTGAGT GCT GAGGCC GGC CAG 2752 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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PI Zhong H; 
XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71610. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer , diabetes , infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics. 
XX 

PS Example 21; SEQ ID NO 505; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator , 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide ' and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 985 C; 868 G; 502 T; 0 U; 0 Other; 

Query Match 97.3%; Score 2676.4; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2728; Conservative 0; Mismatches 21; Indels 9; Gaps 3; 

CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGCAGAGT GCCACCGT GGC CAACC CAGT GCCT GGT GC CAAC CCGGACCT GCTTCC C CAC 221 

TT CCT GGT GGAGCC C GAGGAT GT GT ACAT CGT CAAGAACAAGCCAGT GCT GCT T GT GT GC 240 
I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
TT CCTGGT GGAGC C CGAGGATGT GT ACAT C GT CAAGAACAAGC CAGT GCT GCT T GT GT GC 281 

AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

GAC CAC GT GAT CGAGCGCAGCACAGAC GGGAGC AGT GGGCT GCCC AC CAT GGAGGT CCGC 360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGTGAGCCGACCAT GGAGGT CCGC 401 



Qy 


l 


Db 


42 


Qy 


61 


Db 


102 


Qy 


121 


Db 


162 


Qy 


181 


Db 


222 


Qy 


241 


Db 


282 


Qy 


301 


Db 


342 



361 ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGTGT T C GGGCT GGAGGAAT ACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

402 ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAGGAAT ACT GGT GCCAG 461 

421 T GCGT GGCAT GGAGCTCCT C GGGCAC CAC CAAGAGT C AGAAGGCCT ACAT C CGC AT AGCC 480 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

462 T GCGT GGCAT GGAGCTC CT CGGGCAC CAC CAAGAGT C AGAAGGCCT ACAT C C GCAT AGCC 521 

481 AGAT T GC GCAAGAACTT C GAGC AGGAGCC GCT GGCCAAGGAGGT GT C CCT GGAGC AGGGC 540 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I II I I I I I I I I I I I I 

522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

601 AAC GAGGACCT GGT GGAC C CGT CC CT GGACCCCAAT GT AT ACAT CAC GC GGGAGC ACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

642 AAC GAGGACCTGGT GGACCC GT C C CT GGACCCCAAT GT AT ACAT CAC GCGGGAGC ACAGC 701 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I II I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

901 GTCCAGAA AACAGCCT GCGC CAC C CT GT GCC CAGT AGACGGC AGCT GGAGCC CGT GG 957 

I I I I I I I I I I I I I II I I I I I I I I I I- I I I I I I I I I I I I I I I 

942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACT GACCTGGACACCCGCAACT GT 1077 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 CC AGCACC C CGCAAC GGAGGGGAGGAGT GC CAGGGC ACT GACCT GGACAC C C GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

III || || 1. 1 I II II II III. II I II III I. J. I III III II II II I I.I I II LIU Jill III I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 



1 1 I 1 1 1 1 1 I 1 1 1 1 1 I I I I 1 1 I I 1 1 1 1 1 I II I I I I I 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 

1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

1258 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCG 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1302 CAGCCCGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCATCTGCTCACCATCCAGCCG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 3 62 GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

1 1 1 1 1 1 1 1 1 1 i 1 1 1 in 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1479 ACACT GCACCAC AGCTCT CC CAC CT CT GAGGCCGAGGAGT TC GT CT CC CGC CT CT C CAC C 1538 

14 98 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GCCATACC CC GAGGGAAGAT CT AT GAGAT CT AC CT C ACGCT GCACAAGC C GGAAGAC GT G 1677 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I I I I I 
1659 GCCATACC CCGAGGGAAGAT CT AT GAGAT CTAC CTC ACGCT GCACAAGC C GGAAGAC GT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GAC AGCTGGAGCCT GCGCCT CAAAAAGCAGT CGT GCGAGGGC AGCT GGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCTGGAGC CT GCGCCT CAAAAAGCAGT CGT GC GAGGGC AGCT GGGAGCAGGAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACAT CC GGGT CT ACT GC CT GCAT GACACCCAC GAT GC ACTCAAGGAGGT GGT GCAG 2094 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 



2079 T ACAACAT CC GGGT CT ACT GC CT GCAT GACAC CCAC GAT GC ACT CAAGGAGGT GGTGC AG 2138 



Qy 2095 CT GGAGAAGC AGCT GGGGGGACAGCTGAT C C AGGAGCCACGGGT C CT GCACTT CAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2139 CT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAG CC ACGGGT CCT GCACTT CAAGGAC 2198 

Qy 2155 AGTT AC CACAAC CT GC GCCT ATCCATCC AC GAT GT G CC CAGCT C C CT GT G GAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 

Db 2199 AGTT AC CACAAC CT GCGCCTATCCAT C CACGAT GT GCC CAGCT CCCT GT GGAAGAGTAAG 2258 

Qy 2215 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2259 CT CCTT GT CAGCT ACCAGGAGAT CC CCTT TT AT CAC AT CT GGAAT GGCAC GCAGCGGT AC 2318 

Qy 2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

• I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CT GT GGGT GT GGCAGGT GGAGGGC GAC GGGC AGAGCTT CAGCAT CAACTT CAACATCAC C 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 2379 CT GT GGGT GT GGCAGGT GGAGGGCGAC GGGC AGAGCTT CAGCAT CAACTT CAACATCAC C 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GT GGGCCCC AGT GC CT T CAAGATC CCCTT CCT CATT CGGCAGAAGATAAT TT C CAGC CT G 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2499 GTGGGCCCCAGTGCCTT CAAGATC CCCTT CCT CATT CGGCAGAAGATAAT TTC CAGC CTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I II i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I ! I I I I ill I I I I I I I 

Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGAC GCT GGCCT CTT CACAGT GT C GGAGGCT GAGT GCT GAGGC CGGC CAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, * Gangolli EA, Gerlach VL, Gorman Gunther E, Guo X; 

PI Gusev VY, Herrmann JL f Ji W, Kekuda R f Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar XM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M f Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM f Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71650. 
XX 

PT New N0VX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 545; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 



CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 CAGCAGAGTGC CAC C GT GGC CAACC CAGTGC CT GGT GC CAACC CGGACCT GCT T C C CC AC 221 

Qy 181 T T CCT GGT GGAGC C C GAGGAT GT GTAC ATCGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 T T CCT GGT GGAGC C C GAGGAT GT GT ACATCGTCAAGAACAAGC CAGT GCT GCTT GT GT GC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGGCTGCCCACCAT GGAGGT CCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 342 GACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGTGAGCCGACCAT GGAGGTCCGC 401 

Qy ' 361 ATTAATGT CT CAAGGC AGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAATACTGGT GC CAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATTAAT GT CT CAAGGC AGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAATACTGGTGC CAG 461 

Qy 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 62 T GC GT GGCAT GGAGCT CCTCGGGCAC C ACCAAGAGT CAGAAGGCCT ACAT C CGC ATAGC C 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I II I I I I II I I J I I I I I I I I I III II III II III I I I I I I I I I I I I I I I I I I I I I III II 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 



Qy 



541 



ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 



600 



Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 



601 



642 



661 



702 



721 



7 62 



781 



822 



841 



882 



901 



942 



958 



AACGAGGACCT GGT GGACCCGT CCCT GGAC C CCAAT GT AT ACAT CAC GC GGGAGC AC AGC 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACGAGGAC CT GGT GGACCCGT C C CT GGAC CCCAAT GT AT ACAT CAC GC GGGAGC AC AGC 

CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



660 



701 



720 



761 



780 



821 



840 



881 



900 



941 



957 



GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I I I I I I I I I I I I I I I I II I I II I I I I II I I I II I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGT GGT C GGCCTGT GGGCT GGACT GCACC CACT GGC GGAGC C GTGAGT GCT CT GAC 1017 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 CCAGCACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACTGACCT GGACACCCGCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCT GGACT CAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

1258 CAGCCCGT CAGCAT CAAGC C CAGCAAAGCAGACAAC CC CC AT CT GCT CAC CAT C CAGC C G 1317 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1302 CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCCCCAT CT GCTCACCATCCAGCCG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 



1362 



1378 



AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1479 ACACT GCAC CACAGCT CT CC C AC CT CT GAGGC C GAGGAGTTC GT CT C CC GCCT CT CCAC C 1538 

1498 GAGAACT ACTT C C GCT C CCT GCC CCGAGGCAC CAGCAACAT GAC CT AT GGGAC CT TCAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I 
1539 CAGAACT ACTTCCGCT C C CT GCC C CGAGGCAC CAGCAACAT GAC CT AT GGGAC CT TCAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GCCATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCTGCACAAGCCGGAAGACGTG 1677 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1659 GCCATACCCCGAGGGAAGATCTATGAGAT CTACCT CACGCTGCACAAGCCGGAAGACGTG 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I U I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
1839 GACAGCTGGAGC CT GCGC CT CAAAAAGCAGT C GTGC GAGGGCAGCT GGGAGCAG GAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I III I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 

2 019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACATCCGGGTCTACTGCCTGCATGACACCCAC GAT GCACTCAAGGAGGTGGTGCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
2079 T ACAACAT C CGGGT CTACT GCCT GCAT GACACC C AC GAT GCACT CAAGGAGGTGGTGCAG 2138 



2095 



2154 



CT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGCCAC GGGT C CT GCACTT CAAGGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2198 

2155 AGTT AC CACAACCT GC GCCT AT C CATC CAC GAT GT GCC CAGCT C CCT GT GGAAGAGTAAG 2214 

I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2199 AGTT AC CACAAC CT GC GCCT ATC CAT C CAC GAT GT GCC CAGCT C CCT GT GGAAGAGTAAG 2258 

2215 CT CCTT GT CAGCT AC C AGGAGAT C C C CTTTT AT C ACAT CT GGAATG GC AC GCAGCGGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
2259 CT CCTT GT CAGCT AC CAGGAGAT C C CCTTTT AT C ACAT CT GGAAT GGCAC GC AGC GGT AC 2318 



Qy 2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 2319 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2379 CT GT GGGT GT GGCAGGT GGAGGGC GACGGGCAGAGCTT C AGC AT CAACTTCAACAT CAC C 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2439 AAGGACACAAGGTT TGCT GAGCT GCTGGCT CT GGAGAGT GAAGC GGGGGT CC C AGC CCT G 2498 

Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I i I I I 

Db 2499 GT GGGC C CCAGT GCCTT CAAGAT CCCCTTCCT CAT TC GGCAGAAGATAATTT C CAGCCT G 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGCGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 , 
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PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71636. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 531; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 



SQ Sequence 2881 BP; 527 A; 985 C; 867 G; 502 T; 0 U; 0 Others- 



Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy . 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I II I I I I I I I 

Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACC ACGTGAT C GAGCGCAGCACAGACGGGAGCAGT GG GCT GCC CACCATGGAGGTC C GC 360 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 342 GACCACGT GAT C GAGCGCAGCACAGACGGGAGCAGT GGT GAGCCGACCATGGAGGTCCGC 4 01 

Qy 361 ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GC CAG 461 

Qy 421 T GC GT GGCATGGAGCT CCTC GGGCACCAC CAAGAGT CAGAAGGC CT ACAT CCGC AT AGCC 4 80 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 462 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 521 

Qy 481 AGATTGC GCAAGAACT TC GAGCAGGAGCCGCT GGC CAAGGAGGT GT CCCT GGAGC AGGGC 540 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AAC GAGGACCT GGT GGAC CC GT CC CTGGAC C C CAATGT AT ACAT CACGCGGGAGCACAGC 660 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 642 AAC GAGGAC CT GGT GGACCC GT CCCTGGACC CCAAT GT AT ACAT CACGCGGGAGCACAGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



7 62 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 



781 



840 



TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 



841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



901 



942 



958 



900 



941 



957 



GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 C CAGCAC CCC GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC ACC C GCAACT GT 1077 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1062 C CAGCAC CCC GCAAC GGAGGGGAGGAGTGCCAGGGC ACT GAC CT GGAC ACC C GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 C GGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACTCGTC CATT CT C ACCT CAGGCT T C 1257 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

1242 CGGAAGAAGGAGGGGCTGGACT CAGAT GTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

1258 C AGC CCGT CAGCATCAAGC C CAGCAAAGCAGACAAC CCCCAT CT GCT C AC C AT CCAGC C G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1302 C AGCCCGTCAGCATCAAGC CCAGCAAAGCAGACAAC CCC CAT CT GCT C AC CAT C CAGC C G 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1362 GACCTCAG CACCAC CAC CAC CT ACCAGGGCAGT CT CTGT CC C CGGCAGGAT GGGCC C 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCT GCT CAGC CCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 CAGAACT ACT TCCGCT C C CT GCC C CGAGGCAC CAGCAACAT GAC CT AT GGGAC CTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1539 CAGAACT ACTTC C GCTCCCTGCCCC GAGGCAC CAGCAACAT GACCT AT GGGAC CT T CAAC 1598 

1558 TTC CTC GGGGGCC GGCT GAT GAT C C CTAAT AC AGGT AT CAGC CT C CT CAT C C C C C CAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 



Qy 1618 GCC ATAC CC CGAGGGAAGAT CT AT GAGAT CT AC CT CAC GCT GC ACAAGC C GGAAGAC GT G 1677 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 it i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1659 GCC AT ACCCC GAGGGAAGAT CT AT GAGAT CT ACCT CAC GCT GCACAAGCCGGAAGACGT G 1718 

Qy 1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

Qy 1798 GACAGCT GGAGCCT GC GC CT CAAAAAGC AGT C GTGC GAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1839 GACAGCT GGAGCCTGC GC CT CAAAAAGC AGT CGTG C GAGGGC AGCT GGGAGCAGGAT GT G 1898 

Qy 1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

Qy 1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1959 TGCTACATCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

Qy 1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2035 T ACAAC ATCC GGGTCT ACT GCCT GC AT GACAC C CAC GAT GCACT CAAGGAGGT GGT GC AG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2079 T ACAAC ATCC GGGTCT ACT GC CT GCAT GACAC C CAC GAT GCACT CAAGGAGGT GGT GC AG 2138 

Qy 2095 CTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGTCCTGCACTTCAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2139 CT GGAGAAGCAGCTGGGGGGAC AGCT GAT C CAGGAGCCACGGGT CCT GCACTT CAAGGAC 2198 

Qy 2155 AGTT AC CACAACCTGC GC CT AT CCAT CCAC GAT GTGCCC AGCT C CCT GT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2199 AGTT AC CACAAC CTGC GC CT AT CCAT CCAC GAT GT GCCC AGCT C CCT GT GGAAGAGTAAG 2258 

Qy 2215 CTCCTT GTCAGCT AC CAGGAGAT C CC CTTTTAT CACAT CTGGAAT GGCAC GC AGC GGTAC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2259 CTCCTT GTCAGCTAC CAGGAGAT C C C CTTTTAT CACAT CTGGAAT GGCAC GC AGC GGT AC 2318 

Qy 2275 T TGCACT GCACCT T CAC C CT GGAGCGT GT CAGCCC CAGC ACT AGT GAC CT GGCCT GCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 
Db 2319 TTGCACTGCACCTTCACCCT GGAGCGT GTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2378 

Qy 2335 CTGT GGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CTGT GGGTGT GGCAGGT GGAGGGCGAC GGGCAGAGCTT CAGCAT CAACTT CAAC AT C ACC 2438 

Qy 2395 AAGGACACAAGGTTT GCT GAGCT GCT GGCTCTGGAGAGTGAAGCGGGGGTCC CAGC CCTG 2454 

I III I I I II I I III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 



Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 



RESULT 8 
ADH71637 

ID ADH71637 standard; DNA; 2881 BP. 
XX 

AC ADH71637; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21o SEQ ID NO: 533. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer f s disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia . 

XX 
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XX 
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PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 
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PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 533; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are. encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 527 A; 985 C; 867 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 



Qy 



61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 
I I I I I I I I I I II I I I I I II I I I II II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 



102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC '221 

181 T T CCTGGT GGAGC C C GAGGATGT GT ACAT C GT CAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
222 TT C CT GGT GGAGC C C GAGGATGT GT ACAT C GTCAAGAACAAGC CAGT GCT GCTT GT GTGC 281 

241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

301 GACCACGT GATCGAGCGCAGCACAGACGGGAGCAGT GGGCT GCCCACCATGGAGGTCCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
342 GACCACGT GATCGAGCGCAGCACAGAC GGGAGC AGT GGT GAGC C GAC CAT GGAGGT C C GC 401 

361 AT TAAT GT CT CAAGGCAGC AGGT CGAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GC CAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
402 AT TAAT GT CT CAAGGCAGC AGGT C GAGAAGGTGT T C GGGCT GGAGGAAT ACT GGT GC CAG 461 

421 T GC GT GGCAT GGAGCTC CT C GGGC AC C AC CAAGAGT CAGAAGGC CT ACAT CC GC AT AGC C 480 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

462 T GCGTGGCAT GGAGCTC CT C GGGCAC CAC CAAGAGT CAGAAGGC CT ACAT CC GC AT AGCC 521 

481 AGATTGCGCAAGAACTT C GAGCAGGAGCC GCTGGCCAAGGAGGT GT C CCT GGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
522 AGATTGCGCAAGAACTT CGAGCAGGAGCC GCTGGC CAAGGAGGT GT CCCT GGAGCAGGGC 581 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

601 AACGAGGAC CT GGT GGAC C CGT C CCT GGAC CCCAAT GT AT ACAT C AC GC GGGAGCACAGC 660 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
642 AACGAGGAC CTGGTGGACCCGT CCCT GGACCCCAAT GTATACATCACGCGGGAGCACAGC 7 01 

661 CT GGTGGT GCGACAGGC CC GCCT T GCT GACACGGC CAACT ACAC CT GCGT GGCCAAGAAC 720 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

901 GTCCAGAA AACAGC CT G C GCCACCCT GT GC CC AGTAGAC GG C AGCT GGAGC C CGT GG 957 

I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I 

942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I | | | | | | || | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

Qy 1018 CCAGCACCCC GCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACAC CCGCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1062 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT .1121 

Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 
Db 1122 AC CAGT GAC CTCT GT GT AC ACAGT GCTT CT GGC C CT GAGGAC GT GGC CCT CT AT GT GGGC 1181 

Qy 1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

Qy 1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1242 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1301 

Qy 1258 CAGC CCGT CAGCAT CAAGC CCAGCAAAGCAGACAAC CCC C AT CT GCT CAC CAT CCAGCC G 1317 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1302 CAGC CC GT CAGCAT CAAGC CCAGCAAAGCAGACAAC CCC CAT CT GCT CAC CAT C CAGCC G 1361 

Qy 1318 GACCTC AGCACCACC AC CAC CAC CT ACCAGGGCAGT CT CT GT CC CCGGCAGGAT GGGC CC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1362 GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 

Qy 1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

Qy 1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

Qy 1498 CAGAACT ACTT CC GCT CCCT GCCC CGAGGCACCAGCAACAT GACCTAT GGGAC CT T CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1539 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1598 

Qy 1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

Qy 1618 GC CAT ACC C CGAGGGAAGAT CTAT GAGAT CT AC CT CAC GCT GCACAAGCC GGAAGACGT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1659 GCCAT AC CCC GAGGGAAGAT CTAT GAGAT CT AC CT CAC GCT GCACAAGC CGGAAGAC GT G 1718 

Qy 1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I i I I I I I II I I I 
Db 1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 



Qy 
Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCTGGAGCCT GC GCCT CAAAAAGC AGT C GT GC GAGGGCAGCT GGGAGCAGGAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 
2019 GCTGCCACCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGAT GCACT CAAGGAGGTGGTGCAG 2094 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 TACAACATCCGGGT CTACTGCCT GCATGACACCCACGAT GCACT CAAGGAGGTGGTGCAG 2138 



2095 CT GGAGAAGCAGCT GGGGGGACAGCTGAT CCAGGAGCCACGGGT CCT GC ACTT CAAGGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CTGGAGAAGCAGCTGGGGGGACAGCTGAT CCAGGAGCCACGGGT CCTGCACTTCAAGGAC 

2155 AGT T AC CACAAC CT GCGCCT ATC C ATCC ACGAT GT GCC C AGCT CCCT GT GGAAGAGTAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTT AC CACAACCT GCGCCT ATCC ATCCAC GAT GT GC C C AGCT CCCT GT GGAAGAGTAAG 



2199 



2215 



2259 



CT C CTT GT C AGCT AC CAGGAGAT C C CCTTTT AT CACAT CT GGAAT GGCAC GC AGCGGT AC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CT CCTT GT C AGCT AC CAGGAGAT CC C CTTTT AT CACAT CT GGAAT GGCAC GCAGCGGT AC 



2275 TT GCACTGCACCT T CACC CT GGAGC GT GT CAGCCCC AGCACT AGT GACCT GGCCT GCAAG 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 



2319 



2335 



2379 



2395 



2439 



CT GTGGGT GT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACC 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
CT GT GGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGCAT CAACTT CAACATCACC 



2154 



2198 



2214 



2258 



2274 



2318 



2334 



2378 



2394 



2438 



AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 



2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I II I I II I I I I II I I I 

2559 GACCCACC CTGTAGGCGGGGT GCC GACT GGC GGACT CT GGCCCAGAAACT C C AC CTGGAC 2618 

2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I II I I I II I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 



1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 



Qy 2695 GGCCAGC CAGAC GCT GGC CT CTT CACAGT GT CGGAGGCT GAGT GCT GAG GCCGGC CAG 2752 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 

RESULT 9 
ADH71641 

ID ADH71641 standard; DNA; 2881 BP. 
XX 

AC ADH71641; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention N0V21q SEQ ID NO: 537. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 

PN WO2003102155-A2. 
XX 
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(CURA-) CURAGEN CORP. 

Alsobrook JP, Alvarez E, Anderson DW, Boldog FL f Casman SJ; 

Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

Ettenberg S, Gangolli EA, Gerlach VX f Gorman L, Gunther E, Guo X; 



PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI . Padigaru M, . Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71642. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 537; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator , 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 867 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGT GCCAC C GT GGCCAACC CAGTGCCT GGT GC CAACCC GGAC CT GCT T CC C CAC 180 

I I I I I I I I II I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 
Db 162 CAGCAGAGT GC CACC GT GGCCAACCCAGTGCCTGGTGC CAACCC GGAC CT GCT TCCC CAC 221 

Qy 181 T T CCT GGT GGAGC CC GAGGAT GT GT ACAT C GT CAAGAACAAGCCAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 



Qy 301 GACCACGT GAT CGAGC GCAGC AC AGAC GGGAGC AGT GGGCT GC C C AC CAT GGAGGT C C GC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I III I I I I I I I I I I II I I I 
Db 342 GAC CACGT GAT C GAGCGCAGCAC AGAC GGGAGC AGT GGTGAGCC GAC CAT GGAGGT C C GC 4 01 

Qy 361 AT T AATGT CT CAAGGCAGCAGGT C GAGAAGGT GT T CGGGCT GGAGGAAT ACTGGTGCC AG 420 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATT AATGT CT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAAT ACTGGT GCCAG 461 

Qy 421 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 462 TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AAC GAGGACCT GGT GGACCCGT C CCT GGACC CCAAT GT AT ACAT CAC GCGGGAGC ACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 642 AAC GAGGAC CT GGT GGACCC GT CCCT GGACCCCAAT GT AT ACAT CACGC GGGAGCACAGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 702 CT GGT GGT GCGACAGGC CCGC CTT GCT GACACGGC CAACT ACAC CT GC GT GGC CAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

Qy 901 GTCCAGAA AACAGC CTGC GCCAC CCT GT GCC CAGT AGACGGCAGCT GGAG C CCGT GG 957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

Qy 1018 CCAGC ACCCC GCAACGGAGGGGAGGAGT GCCAGGGCACTGACCT GGACAC C CGCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1062 C CAGC ACCCCGCAACGGAGGGGAGGAGT GCCAGGGCACTGACCT GGACAC C CGCAACT GT 1121 

Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTT.CTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 



1182 



1257 



1198 CGGAAGAAGGAGGGGCT GGAC T CAGAT GTGGCT GACT C GT C CATT CT CACCTC AGGCT T C 
• I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1242 CGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT C GT C CAT T CT CACCTC AGGCTT C 1301 

1258 CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCCCCATCT GCT CACCAT CCAGCCG 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1302 CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCCCCATCTGCT CACCAT CCAGCCG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACT GCACCACAGCT CT CCCAC CT CTGAGGC C GAGGAGTT CGT CT C C C GC CT CTC C AC C 1497 

1 1 1 1 i ii 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 

1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 CAGAACT ACTT C C GCT C C CT GCC C C GAGGCACCAGCAACAT GACCT AT GGGACCTT CAAC 1557 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1539 CAGAACT ACTT CC GCT C CCT GCC C C GAGGCACCAGCAACAT GACCT AT GGGAC CTT CAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TT C CT CGGGGGC C GGCT GAT GAT C C CTAAT AC AGGT AT CAGCCT CCT CAT C CCCCCAGAT 1658 

1618 GC CAT ACCCCGAGGGAAGAT CT AT GAGATCT ACCT C ACGCT GC ACAAGC C GGAAGAC GT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1659 GCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCT GCACAAGCC GGAAGAC GT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I II I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCT GGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1839 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGGAGCAGGATGTG 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2035 T ACAAC AT C C GGGT CT ACT GC CT GC ATGACACCCACGAT GC ACT CAAGGAGGT GGT GCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2079 T ACAACAT C C GGGT CT ACT GCCT GCATGAC ACCC ACGAT GCACT CAAGGAGCT GGT GCAG 2138 

Qy 2095 CT GGAGAAGCAGCT GGGGGGAC AGCT GAT C C AGGAGC CACGGGT CCT GCACT T CAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2139 CT GGAGAAGCAGCT GGGGGGAC AGCTGAT C C AGGAGC CACGGGT C CT GCACT T CAAGGAC 2198 

Qy 2155 AGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2199 AGTT ACCACAACCT GC GCCT AT C C AT CCAC GAT GT GC C C AGCT CC CTGT GGAAGAGT AAG 2258 

Qy 2215 CT C CTT GT C AGCT AC CAGGAGAT C C C CTTTT AT C AC AT CT GGAAT GGCAC GCAGC GGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2259 CT C CTT GT CAGCT ACCAGGAGAT CC CCTT TT AT C AC AT CTGGAAT GGCACGCAGCGGTAC 2318 

Qy 2275 TT GCACT GCAC CTT CACCCT GGAGC GT GT CAG CC C CAGC ACT AGT GACCT GGCCT GCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I 
Db 2319 TT GCACT GCAC CTT CACC CT GGAGCGT GTCAGCC C CAGCACT AGT GAC CT GGCCT GCAAG 2378 

Qy 2335 CTGT GGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACAT CACC 2394 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CT GT GGGT GT GGCAGGT GGAGGGCGAC GGGC AGAGCT T CAGC AT CAACTTCAACAT CAC C 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 24 98 

Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGC CAT CTCAGCTT CTTT GC CT C CAAGCCCAGCC CC ACAGCCAT GATC CT CAACCT GT GG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGC CAGC CAGACGCTGGC CT CT T CACAGT GT C GGAGGCT GAGT GCT GAGGCCGGC CAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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New NOVX polypeptides and nucleic acid molecules useful for preventing or 
treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 



XX 

PS Example 21; SEQ ID NO 525; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and ph a rmaco genomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Other; 



Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 

I II I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 

Qy 121 CAGCAGAGT GC C ACC GT GGC CAAC C CAGT GCCT GGT GCCAACC CGGAC CT GCTT C C C CAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 162 CAGCAGAGT GCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 

Qy 301 GAC CACGT GAT CGAGCGCAGCACAGAC GGGAGC AGT GGGCTGCCC ACC ATGGAGGT C C GC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I 
Db 342 GAC CACGT GAT C GAGCGCAGC ACAGAC GGGAGCAGT GGT GAGC CGACCATGGAGGT CC GC 

Qy 361 AT TAATGT CTCAAGGCAGCAGGT C GAGAAGGT GT T CGGGCTGGAGGAAT ACT GGT GCCAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 02 ATTAAT GT CT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCTGGAGGAAT ACT GGT GC CAG 



3; 

60 

101 

120 

161 

180 

221 

240 

281 

300 

341 

360 

401 

420 

461 



Qy 

Db 



421 
462 



TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCGTGGCATGGAGCTCCTCGGGCACCACCAAGAGTCAGAAGGCCTACATCCGCATAGCC 



480 
521 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



481 



522 



541 



582 



601 



642 



661 



702 



721 



762 



781 



822 



841 



882 



901 



942 



958 



AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 
I I I I I I I I I I I I I i I I t I I I I I I I I I I I I I I I I I I I I I II I I I I II II i I II I I I I II I I I 
AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 

ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 

AACGAGGACCT GGT GGACCC GT C CCTGGACC CCAATGT AT ACAT CAC GCGGGAGCAC AGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACGAGGACCTGGTGGACCCGTCCCTGGACCCCAATGTATACATCACGCGGGAGCACAGC 

CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

I I ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



540 



581 



600 



641 



660 



701 



720 



761 



780 



821 



840 



881 



900 



941 



957 



GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1062 C CAGCACCCC GCAACGGAGGGGAGGAGT GCCAGGGCACTGACCT GGACAC CCGCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCCCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT C GT C CAT T CT CACCT CAGGCTT C 1257 
I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C GGAAGAAGGAGGGGCT GGACTCAGAT GTGGCT GACT C GT C CAT TCT CACCT CAGGCT T C 1301 



1242 



1258 



1302 



C AGCCCGT C AGCAT CAAGCC C AGCAAAGCAGACAAC C C CC AT CT GCT CAC CAT C CAGC C G 1317 

I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C AGC C CGT CAGCAT CAAGCC CAGCAAAGCAGACAAC C C CC AT CT GCT CAC CAT C C AGC C G 1361 



1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1362 



1378 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTCAG CAC C AC CAC C AC CT AC CAGGGCAGTC T CT GTCC CC GGC AGGAT GGGCC C 1418 



AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACT GC AC CAC AGCTCT CCCACCT CT GAGGCC GAGGAGT T CGT CT CCCGCCTCTC CAC C 1497 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I II I I 
1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 C AGAACT ACTT C CGCTCC CT GCC C C GAGGC ACC AGCAACAT GAC CT AT GGGAC CTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACT ACTT C C GCTC C CT GCC C CGAGGC ACCAGCAACAT GAC CT AT GGGAC CTT CAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

1618 GCCAT AC CCCGAGGGAAGAT CT AT GAGATCT AC CT CAC GCT GCACAAGC CGGAAGAC GT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1659 GCCAT AC C CC GAGGGAAGATCT AT GAGATCT ACCT CAC GCT GCACAAGCCGGAAGAC GT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GAC AGCT GGAGC CT GC GCCT CAAAAAGC AGT CGT GC GAGGGCAGCT GGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCT GGAGC CT GC GCCT CAAAAAGC AGT CGT GC GAGGGCAG CT GGGAGC AGGAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACATCCGGGTCTACTGCCTGCAT GACACCCACGAT GCACT CAAGGAGGTGGT GCAG 2094 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACT CAAGGAGGTGGT GCAG 



2095 CTGGAGAAGCAGCTGGGGGGACAGCT GATCCAGGAGCCACGGGT CCT GCACTT CAAGGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CT GGAGAAGCAGCT G GGGGGACAGCT GAT C CAGGAGC CAC GGGT CCT GCACTT CAAG GAC 

2155 AGTT ACC ACAAC CT GCGCCT AT C CAT CC AC GAT GT GC C CAGCT C CCT GT GGAAGAGTAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 



2138 



2154 



2198 



2214 



Db 



2199 AGTT ACCACAAC CT GC GC CTAT CCATCCACGATGT GCC CAGCT C C CTGT GGAAGAGT AAG 



2258 



Qy 2215 CT C CTT GTCAGCT AC CAGGAGAT CCCCTTTT ATCACAT CT GGAAT GGC AC GC AGCGGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2259 CT C CTT GT CAGCT ACCAGGAGAT C C CCTTTTAT C ACAT CTGGAAT GGC AC GC AGC GGT AC 2318 

Qy 2275 TT GC ACT GCAC CTT CACC CT GGAGC GT GT C AGCC C C AGC ACT AGT GAC CT GGC CT GCAAG 2334 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2319 TT GC ACT GCAC CTT CACC CT GGAGC GTGTCAGCCCC AGC ACT AGT GAC CT GGC CT GCAAG 2378 

Qy 2335 CT GT GGGT GT GGC AGGT GGAGGGC GACGGGCAGAGCTT CAGC AT CAACTT CAACAT CACC 2394 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CTGT GGGTGT GGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 99 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II II I I I I I I I I I I II I I II I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGC CAGC CAGAC GCT GGCCT CTT CACAGT GT CGGAGGCT GAGTGCT GAGGC C GGCC AG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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ADH71631 

ID ADH71631 standard; DNA; 2881 BP. 
XX 

AC ADH71631; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention N0V211 SEQ ID NO: 527. 
XX 

KW ds; gene; human; cytostatic; immunomodulator ; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson's disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 



PM 
riN 


WO2003102155 


YY 
AA 










" 11 


-DEC- 


2003 . 


YY 








r E 


o^ 


— iTTIM— 


900^ • 


YY 
AA 








DD 

r K 


0*3 


U UiN 


9009 • 

Z U U £. f 


DD 

r K 


04 


UU1N 


9009 • 


DD 

r K 


ns 


-.TTTM- 
U UIN 


9009 • 


DD 


OS 
Uj 


- .TTTM- 
U UIN 


9009 • 


DD 

rK 


U D 


- .TTTM— 
U UIN 


9009 • 


DD 

rK 


Ofi 
U D 


U UN 


9 009- 


DD 

rK 


U D 


-.TTTM- 
U UIN 


9009 • 


DD 

rK 


o^ 


— TTTM — 
U U IN 


9 009 • 
Z U UZ / 


DD 

PK 


u / 


— TT TTJ — 
U UN 


9 nn9 • 

Z UUZ / 


DD 

rK 


u / 


— TTTM — 
d UN 


9 nn9 • 

Z UUZ / 


DD 

rK 


u / 


— TTTM — 


9 H09 • 
Z UUZ / 


DD 

rK 


u / 


TTTM — 


9009 • 
Z UUZ f 


DD 

rK 


n7 


_ TTTM — 
-J UIN 


9 009 • 
Z UUZ f 


DD 

rK 


u / 


— TTTTvT — 
-J UN 


9 009 • 
Z UUZ / 


DD 

rK 


n o. 
Uo 


TTTM 
-J UN 


z uuz ; 


rK 


i n 

1U 


— TTTTvT — 
O UJN 


9 009 • 
Z UUZ / 


DD 

rK 


1 u 


- TTTM — 
U UJN 


9009 • 
Z U UZ / 


DD 

rK 




TTTM 
J UN 


z uuz ; 


DD 

rK 


ii 


TTTM 
J UN 


Z UUZ / 


rK 


ii 


TTTlvT 

-J UN 


z uuz ; 


PR 


1 1 
ii 


TTTTVT 
-J UN~ 


z uuz ; 


dd 
rK 


ii 


TTTTvT 
-J UN 


z uuz ; 


DD 

PR 


ii 


TTTTVT 

-J UN 


z u uz ; 


DD 

rK 


ii 


TTTTvT 

-J UN 


z uuz ; 


DD 
PK 


ii 


TTTTVT 

- J UN - 


zuuz ; 


n t-> 
rK 


1 o 
iz 


TTTTvT 
J UN 


z uuz ; 


PK 


1 o 
IZ 


TTTTvT 
J UN 


z u uz ; 


T">D 
PR 


1 o 
IZ 


TTTM 
- J UN - 


onno* 
z uuz ; 


r>D 
PK 


1 o 
IZ 


TTTTvT 
-J UN 


z u uz ; 


PK 


1 o 
IZ 


TT TXT 

-J UN 


zuuz ; 


tid 
PK 


i q 
1j 


TTTTVT 
U UN 




DD 
PK 


1 A 
1 fl 


— TTTM — 
O UIN 


9 009 • 
Z UUZ / 


TDD 
PK 


1^ 


— TTTTvT — 
«J UN 


o noo • 

ZUUZ / 


DD 

r K 


1 A 
Ifl 


_ TTTTvT — 
U UN 


0 0 09* 
Z UUZ / 


DD 

rK 


1 A 
1 


— TTTM — 
U UN 


9 009- 

zuuz, 


DD 

PK 


1 / 


— TTTTvT — 
J UN 


9 009- 

zuuz^ 


DD 
rK 


1 7 
J. / 


U UIN 


9 009 • 


DD 
r K 


1 ft 
1 0 


— .TT TM- 
U UJN 


9009 • 
ZUUZ/ 


DD 
rK 




— .TTTM- 
U UiN 


9 009 • 

ZUUZ/ 


DD 
r K 


1 Q 


— .TT TM- 
U UIN 


9009 • 

ZUUZ/ 


DD 
rK 


9 1 
z ± 


— .TT TM - 
U UIN 


■ 9009 • 

ZUUZ/ 


DD 
r K 


1 7 


— TT T T . — 


-9009 • 

ZUUZ/ 


DD 
r K 


Ofi 
U D 




-9009 • 

ZUUZ/ 


DD 
r K 


nq 

U 


— ZiTTfZ- 


-9 009 • 

Z UUZ / 


DD 
r K 






.onno • 
zuuz ; 


DD 

PK 


09 


-AUG- 


•2002; 


PR 


12 


-AUG- 


•2002; 


PR 


12 


-AUG- 


•2002; 


PR 


12 


-AUG- 


•2002; 


PR 


12 


-AUG- 


-2002; 


PR 


13 


-AUG- 


-2002; 



A2. 



2003WO-US017430. 

2002US-0385120P. 
2002US-0385784P. 
2002US-0386041P. 
2002US-0386047P. 
2002US-0386376P. 
2002US-0386453P. 
2002US-0386864P. 
2002US-0387016P. 
2002US-0386796P. 
2002US-0386816P. 
2002US-0386931P. 
2002US-0386942P. 
2002US-0386971P. 
2002US-0387262P. 
2002US-0296960P. 
2002US-0387400P. 
2002US-0387535P. 
2002US-0387610P. 
2002US-0387625P. 
2002US-0387634P. 
2002US-0387668P. 
2002US-0387696P. 
2002US-0387702P. 
2002US-0387836P. 
2002US-0387859P. 
2002US-0387933P. 
2002US-0387934P. 
2002US-0387960P. 
2002US-0388022P. 
2002US-0388096P. 
2002US-0389123P. 
2002US-0389118P. 
2002US-0389120P. 
2002US-0389144P. 
2002US-0389146P. 
2002US-0389729P. 
2002US-0389742P. 
2002US-0389884P. 
2002US-0390006P. 
2002US-0390209P. 
2002US-0390763P. 
2002US-0396706P. 
2002US-0401628P. 
2002US-0402156P. 
2002US-0402256P. 
2002US-0402389P. 
2002US-0402786P. 
2002US-0402816P. 
2002US-0402821P. 
2002US-0402832P. 
2002US-0403448P. 



PR 13-AUG-2002; 2002US-0403459P . 

PR 13-AUG-2002; 2002US-0403531P . 

PR 13-AUG-2002; 2002US-0403532P . 

PR 13-AUG-2002; 2002US-0403563P . 

PR 13-AUG-2002; 2002US-0406317P . 

PR 15-AUG-2002; 2002US-0403617P . 

PR 26-AUG-2002; 2002US-0406182P . 

PR 26-AUG-2002; 2002US-0406355P . 

PR 27-AUG-2002; 2002US-0406240P . 

PR 12-SEP-2002; 2002US-0410084P . 

PR 20-SEP-2002; 2002US-0412528P . 

PR 23-SEP-2002; 2002US-0412731P . 

PR 30-SEP-2002; 2002US-0414801P . 

PR 30-SEP-2002; 2002US-0414839P . 

PR 30-SEP-2002; 2002US-0414840P. 

PR 30-SEP-2002; 2002US-0414954P . 

PR 09-OCT-2002; 2002US-0417186P . 

PR 09-OCT-2002; 2002US-0417406P. 

PR 23-OCT-2002; 2002US-0420639P . 

PR 28-OCT-2002; 2002US-0421156P . 

PR 31-OCT-2002; 2002US-0422690P . 

PR 01-NOV-2002; 2002US-0423130P . 

PR 05-NOV-2002; 2002US-00423798 . 

PR 05-NOV-2002; 2002US-0423798P . 

PR 12-NOV-2002; 2002US-0425453P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A f Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S f Gangolli EA, Gerlach VL, Gorman Gunther E f Guo X; 

PI Gusev VY, Herrmann JL f Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan Malyankar UM, Mezick AJ, Millet 1^ Mishra VS; 

PI Padigaru Patturajan M f Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME f Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA f Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 
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PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders , e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 527; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator , 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 



CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention* 

XX 

SQ Sequence 2881 BP; 526 A; 984 C; 868 G; 503 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 
Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 240 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TT CCTGGT GGAGCCCGAGGAT GT GT ACAT CGT CAAGAACAAGC CAGTGCTGCTT GT GT GC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GAC CAC GT GAT CGAGC GCAGCAC AGAC GGGAGCAGT GGGCT GCCC AC CAT GGAGGT C CGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 342 GACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGTGAGCCGACCATGGAGGTCCGC 401 

Qy 361 ATTAAT GT CT CAAGGCAGCAGGT CGAGAAGGT GT T C GGGCT GGAGGAAT ACT GGT GCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GT T CGGGCT GGAGGAAT ACT GGT GC CAG 4 61 

Qy 421 T GCGTGGCAT GGAGCT CCT C GGGCACCACCAAGAGT CAGAAGGC CT ACAT CCGCAT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 462 T GC GT GGCAT GGAGCT C CT C GGGC AC CAC CAAGAGT CAGAAG GC CT ACAT CCGCAT AGCC 521 

Qy 481 AGAT TGC GCAAGAACTT C GAGCAGGAGC CGCT GGCCAAGGAGGT GT CCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AACGAGGACCTGGT GGACCCGT CCCT GGACCCCAAT GT AT ACAT CACGCGGGAGCACAGC 660 

II III I I I III I I I III I III I II I I I III III I I I I I I III I I I I I III I I I I I I I I I I 

Db 642 AACGAGGACCT GGT GGAC CCGTCC CT GGAC C C CAATGT ATACAT CACGCGGGAGCACAGC 701 



Qy 



661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 



720 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I 

Db 702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

Qy 841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

Qy 901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 957 

I I I I I I II I II M II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

Qy 1018 C CAGCAC C CC GCAACGGAGGGGAGGAGT GCCAGGGCACTGACCT GGACAC C C GCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1062 C CAGCAC CCCGCAAC GGAGGGGAGGAGT GC CAGGGCACTGACCT GGACAC C CGCAACTGT 1121 

Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

Qy 1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

Qy 1198 CGGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT C GT CCATTCT CAC CT CAGGCTT C 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
Db 1242 C GGAAGAAGGAGGGGCT GGACT CAGAT GTGGCT GACT C GT CCATT CT CAC CT CAGGCT T C 1301 

Qy 1258 C AGC C CGT CAGCAT CAAGCCCAGCAAAGCAGACAAC CC CCAT CT GCT CAC CAT C CAGCC G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1302 CAGCCCGT CAGCAT CAAGCCCAGCAAAGCAGACAACCCCCATCT GCT CACCATCCAGCCG 1361 

Qy 1318 GACCT CAGCAC CAC CAC C ACCACCT AC C AGGGC AGT CT CT GTC C CCGGCAGGAT GGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1362 GACCT CAG CAC CAC CACCACCT AC CAGGGC AGT CT CT GTC C C CGGCAGGAT GGGCCC 1418 

Qy 1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

Qy 1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 149.7 

I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1479 AC ACT GCACC ACAGCTCT CC CAC CT CT GAG GCCGAGGAGTT C GTCTCCCGCCT CTC C AC C 1538 

Qy 1498 C AGAACT ACTT C CGCTC CCT GCCC C GAGGCACCAGCAACAT GAC CT AT GGGAC CTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1539 CAGAACTACTT CCGCTCCCT GCC CCGAGGCACC AGCAACATGACCT AT GGGACCT T CAAC 1598 



1558 



1599 



1618 



TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TT CCT C GGGGGC CGGCT GAT GAT C C CTAAT ACAGGT ATC AGCCTC CTCAT C C C C CCAGAT 1658 



GCCATACCCCGAGGGAAGAT CTATGAGATCTACCTCACGCTGCACAAGCCGGAAGACGT G 1677 
I I I I I I I I I I I M I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1659 GTCAT ACC C CGAGGGAAGAT CT AT GAGATCT AC CT C ACGCTGC ACAAGC CGGAAGACGT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

173.8 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1779 GGC GT C CT GCT CAC CC GGCCAGT CAT CCT GGCT ATGGAC CACT GT GGGGAGC CCAGC C CT 1838 

1798 GACAGCTGGAGC CT GCGCCT CAAAAAGCAGT C GT GC GAGGGCAGCT GGG AGGATGTG 1854 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCTGGAGC CT GC GCCT CAAAAAGCAGT C GT GCGAGGGC AGCT GGGAGCAGGATGT G 1898 



1855 



1914 



CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 



1915 



1959 



1975 



TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 



GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACAT CCGGGT CTACTGCCTGCATGACACCCACGAT GCACTCAAGGAGGTGGT GCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAG 2138 



2095 



2154 



CTGGAGAAGCAGCT GGGGGGACAGCT GATCCAGGAGCCACGGGTCCT GCACTTCAAGGAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GGGT CCT GC ACTT CAAG GAC 2198 



2155 



2199 



2215 



2259 



2275 



2319 



2335 



AGTTAC CACAAC CT GC GCCT AT CCAT C CAC GAT GT GC CCAGCT CCCT GT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

AGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGGAAGAGTAAG 2258 

CT CCTT GT CAGCT AC C AGGAGAT C C C CTTT T AT CAC ATCT GGAAT GGCAC G C AGC GGT AC 2274 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT C CTT GT CAGCT AC C AGGAGAT CC C CTTT TAT CAC ATCT GGAAT GGC AC GC AGC GGT AC 2318 



TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TT GCACTGCAC CTT CAC C CT GGAGCGT GT CAGCC CCAGCACT AGT GAC CT GGC CT GCAAG 



CT GTGG GT GT GGC AGGT GGAGGGC GACGGGCAGAGCT TC AGC AT CAACT T CAAC AT CAC C 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 



2334 



2378 



2394 



2438 



Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GT GGGCCC C AGT GC CT T CAAGAT C C C CTT CCTCATT CGGC AGAAGATAATT T CCAGC CT G 2514 

I I I I I I I I I I I I I I I I ! I I I II I I I II I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2499 GT GGGCCC C AGT GC CT T CAAGAT C CC CTT CCTCATT CGGCAGAAGATAATTT CCAGC CT G 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I 11 I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCAT CT C AGCT TCTTTGCCTC CAAGCC CAGC C CCAC AGCC ATGAT CCT CAAC CT GT GG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 



RESULT 12 
ADH71645 

ID ADH71645 standard; DNA; 2881 BP. 
XX 

AC ADH71645; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Human gene of the invention NOV21s SEQ ID NO: 541. 
XX 

KW ds; gene; human; cytostatic; immunomodulator; neuroprotective; nootropic; 

KW anorectic; antidiabetic; antimicrobial; antilipaemic; gene therapy; 

KW vaccine; cancer; cachexia; Alzheimer's disease; Parkinson 1 s disease; 

KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens. 
XX 
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XX 
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PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 541; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator , 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 526 A; 986 C; 868 G; 501 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 



Qy 



1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 



1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

4 2 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

121 C AGCAGAGT GCCACCGT GGCCAAC C C AGT GC CT GGT GC CAACC C GGACCT GCT T C C CCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

162 C AGCAGAGT GCC ACC GT GGC CAAC C C AGT GC CT GGT GCCAAC CC GGACCT GCT T C C C C AC 221 

181 T T C CTGGT GGAGC C C GAGGAT GT GT ACAT CGT CAAGAACAAGCCAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
222 T T C CTGGT GGAGC C C GAGGAT GT GT ACAT C GT CAAGAACAAGCCAGT GCT GCTT GT GT GC 281 

241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I II I II I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

301 GACCACGT GATCGAGCGCAGCACAGACGGGAGCAGTGGGCT GCCCACCAT GGAGGTCCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II II I I I I I I I I I 
342 GAC CAC GT GATC GAGCGCAGCACAGAC GGGAGCAGT GGTGAGCC GACC AT GGAGGT C C GC 401 

361 ATTAATGT CT CAAGGCAGCAGGTCGAGAAGGTGTTCGGGCT GGAGGAATACT GGT GCC AG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
402 ATTAATGT CTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCT GGAGGAATACT GGTGCCAG 461 

421 T GC GT GGCAT GGAGCTCCT CGGGCACCACCAAGAGT CAGAAGGC CT ACAT CC GC AT AGCC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 62 T GC GT GGCAT GGAGCTCCT CGGGCAC CAC CAAGAGT CAGAAGGC CT ACAT CCGC AT AGCC 521 

481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
522 AGATT GCGCAAGAACTT C GAGCAGGAGC C GCT GGC CAAGGAGGT GT C CCT GGAGCAGGGC 581 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

601 AACGAGGAC CT GGT GGACCCGT CCCT GGAC C CCAAT GT AT ACAT CACGC GGGAGC AC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
642 AACGAGGAC CT GGT GGAC C CGT CC CT GGAC C CCAAT GT AT ACAT CAC GC GGGAGCAC AGC 701 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I - 
762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1. 1 



Db 



882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



901 



942 



958 



GTCCAGAA AACAGC CT GC GC CAC C CT GT GC C CAGT AGACGGC AGCT GGAGC C C GT GG 957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCC GCAACGGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACACC CGCAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 CCAGCACC C C GCAACGGAGGGGAGGAGT GCC AGGGCACT GAC CT GGACAC C CGCAACT GT 1121 

1078 AC CAGT GAC CT CT GT GT ACACAGT GCTT CT GGCC CTGAGGAC GT GG CC CTCT AT GT GGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1242 CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GTCC AT T CTCAC CT C AGGCT T C 1301 

1258 CAGC CCGTC AGCAT CAAGCCCAGCAAAGCAGACAAC CC C CAT CT GC TCACCAT CCAGCC G 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1302 CAGC CCGTCAGCAT CAAGCC CAGCAAAGCAGACAACCCC CAT CT GCTCAC CAT CCAGCC G 1361 



1318 GACCTCAGC ACCAC CAC CAC CACCT AC CAGGGCAGT CT CTGT CC CCGGC AGGAT GGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GACCTCAG CAC CAC CAC CACCT AC CAGGGCAGT CT CT GT C CCC GGC AGGATGGGC C C 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1479 ACACT GCAC CACAGCT CT CCCAC CT CT GAGGC CGAGGAGTT CGT CT CCCGCCT CT C CACC 1538 

14 98 CAGAACT ACTT C C GCT CC CT GCCC C GAGGCACCAGCAAC AT GAC CT AT GGGAC CT T CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAACT ACTT CC GCT C CCT GCCC C GAGGCACCAGCAAC AT GAC CT AT GGGAC CTT CAAC 1598 



1539 



1558 



1599 



TT C CT C GGGGGCC GGCT GAT GAT C C CTAAT ACAGGT AT CAGC CT C CTCAT CCC CC CAGAT 1617 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TT CCT C GGGGGCC GGCT GAT GAT C C CTAAT AC AGGT AT CAGCCT C CTCAT C CC CC CAGAT 1658 



1618 GCCAT ACCC CGAGGGAAGAT CT AT GAGAT CT ACCT C AC GCT GCACAAGCC GGAAGACGT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCAT ACC C CGAGGGAAGAT CT AT GAGATCT ACCT CAC GCT GCACAAGCC GGAAGACGT G 1718 



1659 



1737 



1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTT GC C CCTAGCT GGCT GTCAGAC CCT GCT GAGTCC CAT CGT T AGCT GTGGACCCCCT 1778 



Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I II I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

Qy 1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1839 GACAGCT GGAGCCT GCGCCT CAAAAAGC AGT CGT GC GAGGGCAGCT GGGAGCAGGAT GT G 1898 

Qy 1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

Qy 1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

Qy 1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

Qy 2035 TACAACATCCGGGTCTACTGCCTGCAT GACACCCACGAT GCACTCAAGGAGGTGGTGCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2079 T ACAAC AT C CGGGT CTACT GC CT GC AT GAC ACC CAC GAT GC ACT CAAGGAGGT GGT GCAG 2138 

Qy 2095 CT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGCCAC GGGT CCT GCACTT CAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2139 CTGGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGT CCT GCACTT CAAGGAC 2198 

Qy 2155 AGTT ACCACAAC CT GCGCCTAT CCAT CCAC GAT GT GCC CAGCTC C CT GT GGAAGAGTAAG 2214 

I I I I I I I I I I I II I I I I I I I I I I I I I I; I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2199 AGT T ACCACAAC CT GCGCCT AT CCAT CCAC GAT GT GCCCAGCT CC CT GT GGAAGAGTAAG 2258 

Qy 2215 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2274 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2259 CT CCTTGT CAGCT AC CAGGAGAT CCC CTTTT AT CAC AT CT GGAAT GGCAC GCAGC GGT AC 2318 

Qy 2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2319 TT GCACC GC ACCTT CAC C CT GGAGC GTGT CAGCC CCAGCACT AGT GACCT GGCCTGCAAG 2378 

Qy 2335 CTGTGGGT GTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCAT CAACTTCAACATCACC 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CT GT GGGT GTGGCAGGT GGAGGGC GACGGGCAGAGCTT CAGCAT CAACTT CAACATCACC 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GT GGGC C C CAGT GC CTT CAAGAT CC C CTT CCTCAT T CGGC AGAAGATAATTT CCAGCCT G 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I M I I I I I I I I I I II I M I I I I I I I I I I II II I I I I I I I I I I I II I I II I I I I I I I 
Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 



2575 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2634 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I 
2619 AGCCAT CT CAGCT T CTT T GC CT C CAAGCCCAGCC CCACAGCC AT GAT CCT CAACCT GT GG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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XX 

AC ADH71627; 
XX 
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XX 
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XX 
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KW obesity; diabetes; infectious disease; metabolic syndrome X; 

KW dyslipidaemia. 

XX 

OS Homo sapiens . 
XX 

PN WO2003102155-A2. 
XX 
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PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Alvarez E, Anderson DW, Boldog FL, Casman SJ; 

PI Catterton E, Chapoval A, Crabtree-Bokor JR, Edinger SR, Ellerman K; 

PI Ettenberg S, Gangolli EA, Gerlach VL, Gorman L, Gunther E, Guo X; 

PI Gusev VY, Herrmann JL, Ji W, Kekuda R, Li L, Liu X, Macdougall JR; 

PI Maclachlan T , Malyankar UM f Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 

PI Zhong H; 

XX 

DR WPI; 2004-081935/08. 

DR P-PSDB; ADH71628. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, diabetes, infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 523; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 525 A; 985 C; 869 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels . 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 



Qy 



181 



TT C CT GGT GGAGCCC GAGGAT GT GT ACAT CGT CAAGAACAAGCC AGT GCT GCTT GT GT GC 
I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



240 



222 TTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCAGTGCTGCTTGTGTGC 281 

241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
282 AAGGCCGTGCGCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

301 GACCACGTGATCGAGC GCAGCACAGAC GGGAGCAGT GGGCT GCC CAC CAT GGAGGT CCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
342 GACCAC GTGATCGAGC GCAGCACAGAC GGGAGCAGT GGT GAGCC GAC CAT GGAGGT CCGC 401 

361 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GT T C GGGCT GGAGGAAT ACT GGTGCCAG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
402 ATTAAT GTCT CAAGGCAGCAGGT C GAGAAGGT GTT C GGGCT GGAGGAAT ACT GGT GCC AG 461 

421 T GC GT GGCAT GGAGCT CCT CGGGC AC CAC CAAGAGT C AGAAGGCCTACAT C CGC ATAGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
462 T GC GT GGCAT GGAGCT CCT CGGGC AC CAC CAAGAGT C AGAAGGCCTACAT C CGCAT AGC C 521 

4 81 AGATTGC GCAAGAACTTC GAGCAGGAGC C GCT GGCCAAGGAGGT GTC C CT GGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
522 AGATTGC GCAAGAACTTC GAGCAGGAGC CGCT GGCCAAGGAGGT GTC C CT GGAGCAGGGC 581 

541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 
582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

601 AACGAGGACCTGGTGGAC C C GT CC CT GGACC C CAAT GT AT AC AT CAC GC GGGAGCAC AGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
642 AACGAGGAC CTGGT GGAC C CGT CCCT GGAC CC CAAT GT AT AG AT C AC GCGGGAGC ACAGC 701 

661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
702 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 7 61 

721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

7 81 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 
822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

841 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 900 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 941 

901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 957 

Mill I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I 

942 GT C CAT GAC CGCACCGTCTCCTCTCT GCT TGTCTCTGT GGAC GGCAGCTGGAGCCCGTGG 1001 

958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 C CAGCACCC C GCAAC GGAGGGGAGGAGT GCC AGGGC ACT GAC CT GGACACC CG CAACT GT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1062 CCAGCACCCCGCAAC GGAGGGGAGGAGT GCCAGGGC ACT GAC CTGGACACCCGCAACTGT 1121 



Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1122 ACCAGTGACCTCTGTGTGCACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

Qy 1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i 

Db 1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

Qy 1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1242 CGGAAGAAGGAGGGGCT GGACT CAGAT GT GGCT GACT C GTC C AT T CTCACCT CAGGCT T C 1301 

Qy 1258 CAGC C C GTC AGCAT CAAGC C CAGCAAAGCAGACAAC C C CC AT CT GCTCAC C AT CCAGC CG 1317 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 1302 CAGC C C GTCAGCAT CAAGC C CAGCAAAGCAGACAAC C C CCAT CT GCT CACC AT CCAGCCG 1361 

Qy 1318 GACCT CAGCAC CAC CACCAC C AC CTAC CAGGGCAGT CT CT GT CC C C GGCAGGAT GGGCCC 1377 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1362 GACCTCAG CACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGAT GGGCCC 1418 

Qy 1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

Qy 1438 ACACT GCACCACAGCT CT CC C AC CT CT GAGGC C GAGGAGTT C GT CT C C C GC CT CT C CAC C 1497 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1479 AC ACT GCACCACAGCT CT CCCAC CT CT GAGGC CGAGGAGTT C GT CT C C C GCCT CT C CAC C 1538 

Qy 14 98 CAGAACT ACT T CCGCT CCCT GCCCCGAGGCAC CAGCAACAT GAC CT AT GGGAC CT T CAAC 1557 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1539 CAGAACT ACT T CCGCT CCCTGCCCC GAGGCAC CAGCAACAT GACCTAT GGGAC CT T CAAC 1598 

Qy 1558 TT CCTC GGGGGCCGGCT GAT GAT C C CTAAT AC AGGT AT CAGC CT C CTC AT CC C CCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db • 1599 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1658 

Qy 1618 GCCATACCCCGAGGGAAGATCTATGAGATCTACCT CACGCT GCACAAGCCGGAAGACGTG 1677 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1659 GCCATACCCCGAGGGAAGATCTAT GAGATCTACCT CACGCT GCACAAGCCGGAAGACGT G 1718 

Qy 1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

Qy 1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

Qy 1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGATGTG 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1839 GACAGCT GGAGCCT GC GCCT CAAAAAGCAGT C GT GC GAGGGCAGCT GGGAGCAGGAT GT G 1898 

Qy 1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 



1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 T ACAACATC CGGGTCT ACTGC CT GCAT GACAC C C AC GAT GCACT CAAGGAGGT GGT GCAG 2094 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

2079 T ACAACAT CC GGGT CT ACT GCCT GCAT GACAC C CACGAT GCACT CAAGGAGGT GGT GCAG 2138 

2095 CT GGAGAAGCAGCT GGGGGGAC AGCT GAT C CAGGAGCC ACGGGT C CT GCACT T CAAGGAC 2154 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 

2139 CTGGAGAAGCAGCTGGGGGGACAGCT GAT CCAGGAGCCACGGGTCCTGCACTT CAAGGAC 2198 

2155 AGT T AC C ACAAC CTGCGC CT AT C CAT C CACGAT GT GCC CAGCT C CCT GTG GAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 

2199 AGT T AC CACAAC CTGC GC CT AT C CAT C CAC GAT GT GCC CAGCT C CCT GTGGAAGAGTAAG 2258 

2215 CTCCTT GT CAGCT AC CAGGAGAT CC CCTTTT AT CACATCTGGAAT GGC AC GCAGC GGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I I I I I I I I 

2259 CTCCTT GTCAGCT AC CAGGAGAT CC C CT TTTAT CAC AT CTG GAAT GGCACGCAGC GGTAC 2318 

2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2319 TTGCACT GCACCT TCACC CT GGAGC GT GT CAGC CC CAGCACT AGT GAC CT GGC CT GCAAG 2378 

2335 CT GT GGGTGT GGCAGGT GGAGGGCGACGGGCAGAGCTT CAGC AT CAACTT CAACAT CAC C 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCC CAGC C CTG 2498 

2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCGAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2499 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2558 

2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

2575 AGC C AT CTCAGCTT CT TT GC CT CCAAGCC CAGCCCCAC AGC CAT GAT C CT CAAC CT GT GG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

2635 GAGGCGCGGCACTTCCCCAACGGCAACCT CAGC CAGCT GGCTGC AGC AGT GGCTGGACTG 2694 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I 

2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 
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XX 
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XX 
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XX 
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XX 
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XX 

PI Alsobrook JP^ Alvarez E, Anderson DW, Boldog FL, Casman SJ; 
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PI Ettenberg S, Gangolli EA, Gerlach VL f Gorman L, Gunther E, Guo X; 
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PI Maclachlan T, Malyankar UM, Mezick AJ, Millet I, Mishra VS; 

PI Padigaru M, Patturajan M, Pena CEA, Peyman JA, Raha D, Rastelli L; 

PI Rieger DK, Rothenberg ME, Sciore P, Shenoy SG, Shimkets RA; 

PI Smithson G, Spytek KA, Stone DJ, Vernet CAM, Voss EZ, Zhong M; 
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XX 
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DR P-PSDB; ADH71640. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders , e.g. cancer, diabetes , infection or 

PT obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 
XX 

PS Example 21; SEQ ID NO 535; 1880pp; English. 
XX 

CC The invention relates to a novel isolated polypeptide (NOVX) . A 

CC polypeptide of the invention has cytostatic, immunomodulator, 

CC neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 

CC antilipaemic activity, and may have a use in gene therapy, and as a 

CC vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 

CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics. The present sequence 

CC encodes a NOVX polypeptide of the invention. 

XX 

SQ Sequence 2881 BP; 525 A; 985 C; 869 G; 502 T; 0 U; 0 Other; 

Query Match 97.2%; Score 2674.8; DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 

Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGC CACCGT GGCCAAC CCAGTGCCT GGT GCCAACC CGGACCT GCTT C CC CAC 180 

II II I I I I I I I I I I I I I II I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TT CCT GGT GGAGCCCGAGGAT GT GT ACATCGT CAAGAACAAGC CAGT GCT GCTT GT GT GC 240 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I II I I I I I I 
Db 222 TT CCT GGT GGAGCC CGAGGAT GT GT ACATCGT CAAGAACAAGCCAGT GCT GCTT GT GT GC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACCACGT GAT C GAGCGCAGCACAGAC GGGAGC AGTGGGCT GC CC ACC AT GGAGGT CCGC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I I I I I I M 
Db 342 GACCACGT GAT C GAGCGCAGCACAGAC G GGAGCAGT GGTGAGC C GAC CAT GGAGGT CCGC 401 



Qy 

Db 



361 
402 



ATTAATGT CT CAAGGCAGCAGGT CGAGAAGGT GTT C GGGCT GGAGGAATACTGGT GC CAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATTAATGT CT CAAGGCAGCAGGTCGAGAAGGTGTT C GGGCT GGAGGAATACTGGT GC CAG 



420 
461 



Qy 421 T GCGT GGC AT GGAGCT CCT CGGGC AC C ACCAAGAGT C AGAAGGCCT AC ATC C GC AT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 462 T GC GT GGCAT GGAGCTCCT CGGGC AC C ACCAAGAGT C AGAAGGCCT AC ATC C GC AT AGC C 521 

Qy 481 AGATTGCGCAAGAACTTCGAGCAGGAGCCGCTGGCCAAGGAGGTGTCCCTGGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I 

Db 522 AGATT GC GCAAGAACTTC GAGC AGGAGCC GCT GGC CAAGGAGGT GT C C CTGGAGC AGGG C 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 ( 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 

Qy 601 AACGAGGACCT GGT GGAC CCGT C CCT GGACCCCAAT GTAT ACAT CACGC GGGAGC ACAGC 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

Db 642 AAC GAGGACCT GGT GGAC CCGT C C CT GGAC CC CAAT GTAT ACAT C AC GC GGGAGC AC AGC 701 

Qy 661 CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 702 CT GGT GGT GC GAC AGGCC CGC CTT GCTGACACGGCCAACTACAC CT GC GTGGCCAAGAAC 761 

Qy 721 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

.Db 762 ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 821 

Qy 781 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 840 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 822 TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 881 

Qy 841 AGC C GGAGCT GC ACCAACCCGGC GC CT CT CAAC GGGGGCGCTT T CT GT GAGGGGCAGAAT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 882 AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGT GAGGGGCAGAAT 941 

Qy 901 GTCCAGAA AACAGCCTGCGCCACCCTGTGCCCAGTAGACGGCAGCTGGAGCCCGTGG 957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 942 GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 

Qy 958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

Qy 1018 CCAGCACCCCGCAACGGAGGGGAGGAGTGCCAGGGCACTGACCTGGACACCCGCAACTGT 1077 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1062 CCAGCACCCCGCAAC GGAGGGGAGGAGTGC CAGGGCACT GACCT GGAC ACCC GCAACT GT 1121 

Qy 1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

Qy 1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

Qy 1198 CGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTCACCTCAGGCTTC 1257 

I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1242 C GGAAGAAGGAGGG GCTGGACT CAGAT GT GGCT GACT C GT C CATT CT CACCT CAGGCTT C 1301 
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1258 CAGC CCGTCAGCAT CAAG C C CAGCAAAGCAGACAACC C CCAT CT GCT CACCAT CC AGCCG 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1302 CAGC C CGT CAGCAT CAAGCCCAGCAAAGC AGACAACC C CCAT CT GCTCACCAT C C AGC C G 1361 

1318 GAC CT C AGCAC C ACCACCAC CAC CT ACCAGGGCAGT CT CTGT CCC C GGC AGGAT GGGC C C 1377 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1362 GACCTCAG CACCACC AC C AC CT ACCAGGGCAGT CT CTGT CCC CGGC AGGAT GGGC CC 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACT GC AC CACAGCT CT CCCAC CT CT GAGGC C GAGGAGTT C GT CT CC C GC CT CT C CAC C 1497 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 
1479 ACACT GC AC CACAGCT CT CC CAC CT CT GAGGC CGAGGAGTT CGT CT C C C GC CT CT CC AC C 1538 

1498 C AGAACT ACTT CCGCT C C CT GCC CCGAGGC AC CAG CAACAT GAC CT AT GGGAC CTT CAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACT ACTT CCGCT CC CT GCC CCGAGGCAC CAGCAACAT GAC CT AT GGGAC CTT CAAC 1598 

1558 TT CCT C GGGGGCCGGCT GAT GAT CCCTAAT AC AGGT AT CAGCCT CCTCAT C CC CC CAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TT C CT C GGGGGC CGGCT GAT GAT CCCTAAT ACAGGT AT CAGC CT C CTCAT CCC CC CAGAT 1658 

1618 GC C ATACC CC GAGGGAAGAT CT AT GAGATCT ACCT C ACGCT GCACAAGCCGGAAGACGT G 1677 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I 
1659 GC CAT ACCCC GAGGGAAGAT CTAT GAGATCT ACCT C ACGCT GCACAAGCCGGAAGACGTG 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1779 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1838 

1798 GACAGCTGGAGCCTGCGCCTCAAAAAGCAGTCGTGCGAGGGCAGCTGGG AGGAT GTG 1854 

I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1839 GACAGCT GGAGCCT GCGCCT CAAAAAGCAGT CGT GC GAGGGCAGCT GGGAGCAGGAT GT G 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 99 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAGGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACAT C C GGGT CT ACT GC CT GC AT GAC ACCCACG AT GCACT CAAGGAGGT GGT GCAG 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I hi 
2079 TACAACATCCGGGTCTACTGCCT GCATGACACCCACGAT GCACT CAAGGAGGT GGT GCAG 



2138 



2095 CT GGAGA^GCAGCT GGGGGGACAGCTGAT C CAGGAGC CACGGGT C CTGCACTT CAAGGAC 2154 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1.1 1 1 1 1 1 1 1 

Db 2139 CT GGAGAAGCAGCT GGGGGGACAGCTGATCCAGGAGC C ACGGGT C CTGCACTT CAAGGAC 2198 

Qy 2155 AGTT AC CACAAC CT GC GCCT AT CCAT C CACGATGT GC C CAGCT CC CTGT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2199 AGTT AC CACAAC CT GCGCCT AT C CAT C CACGATGT GCC CAGCT CC CT GT GGAAGAGTAAG 2258 

Qy 2215 CT CCTTGT CAGCT ACCAGGAGAT CCCCTTTTATCACAT CTGGAATGGCACGCAGCGGTAC 2274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2259 CTCCTTGTCAGCTACCAGGAGATCCCCTTTTATCACATCTGGAATGGCACGCAGCGGTAC 2318 

Qy 2275 T T GCACT GCACCTT CACCCT GGAGC GT GT C AGCC C CAGCACT AGT GACCT GGC CT GCAAG 2334 

I I I II I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I 1 I I I I 1 I I I I I I I I I I I I 
Db 2319 TT GCACT GCACCTT CACCCT GGAGC GT GTCAGCC C CAGCACT AGT GAC CT GGCCT GCAAG 2378 

Qy 2335 CT GT GGGT GT GGC AGGT GGAGGGC GACGGGC AGAGCT T C AGCAT CAACT T CAACAT CAC C 2394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CT GT GGGTGT GGCAGGT GGAGGGC GACGGGC AGAGCT T CAGC AT CAACT TCAACAT CAC C 2438 

Qy 2395 AAGGACACAAGGTT TGCT GAGCT GCTGGCT CT GGAGAGT GAAGC GGGGGT C CCAGCCCT G 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2439 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2498 

Qy 2455 GT GGGC C C CAGT GC CTT CAAGAT C CCCTTCCT CAT T C GGCAGAAGATAATT T C CAG C CT G 2514 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2499 GT GGGC CCCAGTGC CTT CAAGAT CCCCTTCCTCATTC GGCAGAAGATAATT TCCAGCCTG 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCAT CT C AGCTT CTTT GCCT C CAAGCCCAGCC C CACAGCCAT GATC CT CAACCT GT GG 2634 

I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2739 GGCCAGCCAGACGCT GGCCT CTT CACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCC AG 2796 
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New NOVX polypeptides and nucleic acid molecules useful for preventing or 
treating NOVX-associated disorders , e.g. cancer, diabetes, infection or 
obesity, and in chromosome mapping, tissue typing or pharmacogenomics . 

Example 21; SEQ ID NO 539; 1880pp; English. 

The invention relates to a novel isolated polypeptide (NOVX) . A 
polypeptide of the invention has cytostatic, immunomodulator, 
neuroprotective, nootropic, anorectic, antidiabetic, antimicrobial, and 
antilipaemic activity, and may have a use in gene therapy, and as a 
vaccine. The polypeptides are encoded by NOVX polynucleotides comprising 



- CC any of the 303 fully defined nucleotide sequences given in the 

CC specification. The polypeptide is useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease. The 

CC polypeptide, polynucleotide and antibody are useful in diagnosing, 

CC treating or preventing NOVX-associated disorders, e.g. cancer, cachexia, 

CC Alzheimer's disease, Parkinson's disease, obesity, diabetes, infectious 

CC diseases, metabolic syndrome X or dyslipidaemias . The nucleic acids are 

CC further used as hybridisation probes, in chromosome mapping, tissue 

CC typing, preventive medicine, and pharmacogenomics . The present sequence 

CC encodes a NOVX polypeptide of the invention. 
XX 

SQ Sequence 2881 BP; 527 A; 985 C; 867 G; 502 T; 0 U; 0 Other; 



Query Match 97.2%; Score 2674.8; . DB 12; Length 2881; 

Best Local Similarity 98.9%; Pred. No. 0; 

Matches 2727; Conservative 0; Mismatches 22; Indels 9; Gaps 3; 



Qy 1 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 60 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 42 CCGCGGGGCCCCGCGCCCGGCCCGCCCGCCTGCCCGCCCGCGGCCATGGCCGTCCGGCCC 101 

Qy 61 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 102 GGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTCCGCGGCTCGGGTGCC 161 

Qy 121 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 162 CAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCGGACCTGCTTCCCCAC 221 

Qy 181 TT CCT GGT GGAGCC CGAGGAT GT GTACATCGT CAAGAACAAGCCAGT GCT GCTT GT GT GC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 222 TT CCT GGT GGAGCC CGAGGAT GT GTACATCGT CAAGAACAAGCCAGT GCT GCT TGTGTGC 281 

Qy 241 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I 
Db 282 AAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAGTGGGTGCGCCAGGTG 341 

Qy 301 GACCACGT GAT CGAGCGCAGCACAGAC GGGAGCAGT GG GCT GCCC AC CAT GGAGGT C CGC 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Db 342 GACCACGT GAT CGAGCGCAGCACAGAC GGGAGCAGT GGT GAGCCGAC CAT GGAGGT CCGC 401 

Qy 361 ATT AATGT CT CAAGGCAGCAGGT C GAGAAGGTGTT C GGGCT GGAGGAAT ACT GGTGC CAG 420 

I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 402 ATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAGGAATACTGGTGCCAG 461 

Qy 421 T GCGT GGCAT GGAGCT CCTC GGGCACCACCAAGAGT CAGAAGGC CT ACAT C CGCAT AGC C 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 462 T GCGT GGCAT GGAGCT C CTC GGG CAC CACCAAGAGT CAGAAGGC CT AC AT C CG CAT AGC C 521 

Qy 481 AGATT GC GCAAGAACTT C GAGCAGGAGCCGCT GGC CAAGGAGGT GT C CCT GGAGCAGGGC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 522 AGATT GCGCAAGAACTT C GAGCAGGAGC CGCT GGC CAAGGAGGT GT CCCT GGAGCAGGGC 581 

Qy 541 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 600 

I I II I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I II I I I I I I . 

Db 582 ATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAGGTGGAGTGGCTCCGG 641 



Qy 

Db 

Qy 

Db 

Qy 

Db 
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Qy 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



601 



642 



661 



702 



721 



762 



781 



822 



841 



882 



901 



942 



AAC GAGGACCTGGT GGAC C CGT C CCT GGACC CCAAT GT AT ACAT C AC GCGGGAGC ACAGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAC GAGGACCTGGT GGACC CGT CC CT GGACCCCAAT GT AT AC AT CACGCGGGAGCACAGC 



660 



701 



720 



CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

CTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACCTGCGTGGCCAAGAAC 761 



ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I 

ATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTACGTGAACGGTGGGTGG 

TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGCGGCTGGCAGAAACGG 

AGCCGGAGCTGCACCAACCCGGCGCGTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 

AGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTCTGTGAGGGGCAGAAT 



780 



821 



840 



881 



900 



941 



957 



GTCCAGAA AACAGC CT GC GC CAC CCT GT GCC C AGT AGACGGCAG CT GGAGCC C GT GG 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

GTCCATGACCGCACCGTCTCCTCTCTGCTTGTCTCTGTGGACGGCAGCTGGAGCCCGTGG 1001 



958 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1017 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1002 AGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGTGAGTGCTCTGAC 1061 

1018 CCAGCACCCC GCAAC GGAGGGGAGGAGT GC CAGGGC ACT GAC CT GGACACC C GCAACT GT 1077 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 C CAGCACCCC GCAAC GGAGGGGAGGAGT GC CAGGGCACT GAC CT GGACACCC GCAACT GT 1121 

1078 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1137 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1122 ACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCCCTCTATGTGGGC 1181 

1138 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1182 CTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATCCTCGTTTATTGC 1241 

1198 CGGAAGAAGGAGGGGCTGGACT CAGAT GT GGCT GACT C GTC CATT CT CAC CT CAGGCT T C 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1242 CGGAAGAAGGAGGGGCTGGACT CAGAT GT GGCT GACT C GTC CATT CT C ACCTCAGGCT T C 1301 

1258 CAGCCC GTCAGCATCAAGC C CAGCAAAGCAGACAAC CCC CAT CT GCT CAC CAT C CAGC C G 1317 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1302 CAGC CCGT C AGCATCAAGC C CAGCAAAGCAGACAAC CCC CAT CT GCT CAC CAT C C AGC CG 1361 

1318 GACCTCAGCACCACCACCACCACCTACCAGGGCAGTCTCTGTCCCCGGCAGGATGGGCCC 1377 

I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1362 GACCTCAG CACCACCACCACCT AC CAGGGC AGT CT CTGT CC C CGGCAGGAT GGGC C C 1418 

1378 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1419 AGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGTGGCGGCCGCCAC 1478 

1438 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1497 



1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1479 ACACTGCACCACAGCTCTCCCACCTCTGAGGCCGAGGAGTTCGTCTCCCGCCTCTCCACC 1538 

1498 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1557 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1539 CAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTATGGGACCTTCAAC 1598 

1558 TTCCTCGGGGGCCGGCTGATGATCCCTAATACAGGTATCAGCCTCCTCATCCCCCCAGAT 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1599 TT C CT CGGGGGC CGGCT GAT GAT C CCTAATAC AGGT AT C AGC CT C CTC AT CC CC C C AGAT 1658 

1618 GCCAT ACCC CGAGGGAAGAT CT AT GAGAT CT AC CT C AC GCT GCACAAGC CGGAAGAC GT G 1677 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I II I 
1659 GC CAT ACC C CGAGGGAAGAT CT AT GAGAT CT AC CT C AC GCTGC ACAAGC CGGAAGACGT G 1718 

1678 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1737 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 
1719 AGGTTGCCCCTAGCTGGCTGTCAGACCCTGCTGAGTCCCATCGTTAGCTGTGGACCCCCT 1778 

1738 GGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGGGAGCCCAGCCCT 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1779 GGCGT C CT GCT CACCCGGCCAGT CAT C CT GGCT AT GGAC CACT GT GGGGAGC CCAGC C CT 1838 

1798 GACAGCT GGAGCCT GCGC CT CAAAAAGCAGT CGT GC GAG GGCAGCT GGG AGGATGTG 1854 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
1839 GACAGCT GGAGCCT GCGCCT CAAAAAGCAGT CGTGCGAGGGCAGCTGGGAGC AGGATGTG 1898 

1855 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1899 CTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAGGCCAGTGCC 1958 

1915 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1959 TGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCCCTCAGCGTG 2018 

1975 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
2019 GCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACCTCCCTCGAG 2078 

2035 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCT^lGGAGGTGGTGCAG 2094 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2079 TACAACATCCGGGTCTACTGCCTGCATGACACCCACGATGCACTCAAGGAGGTGGTGCAG 2138 

2095 CT GGAGAAGCAGCT GGGGGGACAGCT GAT CCAGGAGC CAC GG GT C CTGCACTT CAAGGAC 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2139 CT GGAGAAGCAGCT GGGGGGACAGCT GAT C CAGGAGC CAC GGGT C CTGCACTT CAAGGAC 2198 

2155 AGTTACCACAAC CT GCGC CT AT C CAT C CAC GAT GT GC C C AGCT C C CTGT GGAAGAGTAAG 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2199 AGTTACCACAACCT GCGCCT AT CCAT CCAC GAT GT GC C C AGCT CC CTGT GGAAGAGTAAG 2258 

2215 CT C CTT GT CAGCT ACC AGGAGAT CC C CTTT TAT C AC AT CT GGAAT GGCACGC AGC GGT AC 2274 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II I I I I I I II I I I I I II I 
2259 CT CCTT GT CAGCT ACC AGGAGAT CC C CTTT TAT C AC ATCT GGAAT GACAC GC AGC GGTAC 2318 

2275 TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 2334 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2319 



TTGCACTGCACCTTCACCCTGGAGCGTGTCAGCCCCAGCACTAGTGACCTGGCCTGCAAG 



2378 



Qy 2335 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2394 

II I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2379 CTGTGGGTGTGGCAGGTGGAGGGCGACGGGCAGAGCTTCAGCATCAACTTCAACATCACC 2438 

Qy 2395 AAGGACACAAGGTTTGCTGAGCTGCTGGCTCTGGAGAGTGAAGCGGGGGTCCCAGCCCTG 2454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2439 AAGGACACAAGGTTT GCT GAGCT GCT GGCT CTGGAGAGT GAAGC GGGGGT C CCAGCC CT G 2498 

Qy 2455 GTGGGCCCCAGTGCCTTCAAGATCCCCTTCCTCATTCGGCAGAAGATAATTTCCAGCCTG 2514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2499 GT GGGCC CCAGT GCCTT CAAGAT CC C CT TC CT CATT CGGCAGAAGATAAT TT C CAGC CT G 2558 

Qy 2515 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2559 GACCCACCCTGTAGGCGGGGTGCCGACTGGCGGACTCTGGCCCAGAAACTCCACCTGGAC 2618 

Qy 2575 AGCCAT CT CAGCTT CTTT GCCTCCAAGC CCAGCC C CACAGCC AT GAT C CT CAACCT GT GG 2634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2619 AGCCATCTCAGCTTCTTTGCCTCCAAGCCCAGCCCCACAGCCATGATCCTCAACCTGTGG 2678 

Qy 2635 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2679 GAGGCGCGGCACTTCCCCAACGGCAACCTCAGCCAGCTGGCTGCAGCAGTGGCTGGACTG 2738- 

Qy 2695 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2752 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2739 GGCCAGCCAGACGCTGGCCTCTTCACAGTGTCGGAGGCTGAGTGCTGAGGCCGGCCAG 2796 



Search completed: March 5, 2005, 22:58:50 
Job time : 1411 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



March 5, 2005, 19:26:23 ; Search time 433.33 Seconds 

(without alignments) 
10391.692 Million cell updates/sec 

US-10-624-932-1 
2752 

1 ccgcggggccccgcgcccgg tgagtgctgaggccggccag 2752 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 1202784 seqs, 818138359 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



2405568 



Post-processing : 



Database : 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/l/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/l/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/l/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/l/ina/6B_COMB. seq: * 

5 : /cgn2_6/ptodata/l/ina/PCTUS^COMB. seq: * 

6 : /cgn2_6/ptodata/l/ina/backfilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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2259 


82.1 


3014 
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US- 


•08- 


808- 


-982-1 


Sequence 


1, Appli 


2 


2259 


82.1 


3014 


3 


US- 


•09- 


-306- 


-902A-1 


Sequence 


1, Appli 


3 


1562.4 


56.8 


1787 


2 


us- 


-08- 


808- 


•982-2 


Sequence 


2, Appli 


4 


1562.4 


56.8 


1787 


3 


us- 


-09- 


306- 


•902A-2 


Sequence 


2, Appli 


5 


841.4 


30.6 


2831 


2 


us- 


-08- 


808- 


•982-3 


Sequence 


3, Appli 


6 


841.4 


30.6 


2831 


3 


us- 


-09- 


•306- 


•902A-3 


Sequence 


3, Appli 


7 


833.6 


30.3 


3008 


4 


us- 


-09- 


-949- 


•016-4794 


Sequence 


4794, Ap 


8 


487 


17.7 


2736 


4 


us- 


-09- 


969- 


•532-9 


Sequence 


9, Appli 


9 


487 


17.7 


3411 


4 


us- 


•09- 


•969- 


-532-33 


Sequence 


33, Appl 


10 


467 


17.0 


2703 


4 


us- 


•09- 


-969- 


■532-11 


Sequence 


11, Appl 


11 


460.2 


16.7 


2694 


4 


us- 


•09- 


-969- 


-532-13 


Sequence 


13, Appl 





12 


439.8 


16 


0 


2661 


4 


US- 


-09- 


-969- 


-532-15 


Sequence 


15, Appl 




13 


323 


11 


.7 


349 


4 


us- 


.09- 


-471- 


-276-345 


Sequence 


345, App 




14 


293.2 


10 


7 


1968 


4 


us- 


-09- 


-969- 


-532-31 


Sequence 


31, Appl 




15 


293.2 


10 


7 


2001 


4 


US- 


-09- 


-969- 


-532-29 


Sequence 


29, Appl 




16 


293.2 


10 


7 


2010 


4 


US- 


-09- 


-969- 


-532-27 


Sequence 


27, Appl 




17 


293.2 


10 


7 


2043 


4 


US- 


-09- 


-969- 


-532-25 


Sequence 


25, Appl 




18 


284.8 


10 


3 


1659 


4 


US- 


-09- 


-969- 


-532-7 


Sequence 


7, Appli 




19 


284.8 


10. 


3 


1692 


4 


us- 


-09- 


-969- 


-532-5 


Sequence 


5, Appli 




20 


284.8 


10. 


3 


1701 


4 


us- 


-09- 


-969- 


-532-3 


Sequence 


3, Appli 




21 


284.8 


10. 


3 


1734 


4 


us- 


-09- 


-969- 


-532-1 


Sequence 


1, Appli 


c 


22 


269 


9. 


8 


771 


1 


us- 


-08- 


■253- 


-155A-17 


Sequence 


17, Appl 


c 


23 


182.2 


6. 


6 


19326 


4 


us- 


-09- 


-949- 


-016-16776 


Sequence 


16776, A 




24 


123.4 


4. 


5 


114139 


4 


us- 


-09- 


•949- 


-016-16536 


Sequence 


16536, A 




25 


119 


4. 


3 


305 


2 


us- 


-08- 


•808- 


-982-4 


Sequence 


4, Appli 




26 


119 


4. 


3 


305 


3 


us- 


09- 


•306- 


-902A-4 


Sequence 


4, Appli 


c 


27 


80.4 


2. 


9 


601 


4 


us- 


-09- 


•949- 


-016-169999 


Sequence 


169999, 




28 


80.2 


2. 


9 


966 


4 


us- 


•09- 


•969- 


-532-23 


Sequence 


23, Appl 




29 


75.8 


2. 


8 


1008 


4 


us- 


•09- 


•969- 


•532-19 


Sequence 


19, Appl 


c 


30 


73.8 


2. 


7 


601 


4 


us- 


•09- 


■949- 


•016-170033 


Sequence 


170033, 


c 


31 


. 66.4 


2. 


4 


601 


4 


us- 


•09- 


949- 


■016-170040 


Sequence 


170040, 


c 


32 


66.4 


2. 


4 


601 


4 


us- 


•09- 


•949- 


•016-170041 


Sequence 


170041, 




33 


63.6 


2. 


3 


5784 


4 


us- 


09- 


•949- 


-016-462 


Sequence 


462, App 


c 


34 


63 


2. 


3 


601 


4 


us- 


09- 


949- 


•016-170000 


Sequence 


170000, 


c 


35 


63 


2. 


3 


601 


4 


us- 


09- 


949- 


•016-170034 


Sequence 


170034, 




36 


60.2 


2. 


2 


2820 


4 


us- 


09- 


854- 


■845-15 


Sequence 


15, Appl 




37 


60.2 


2. 


2 


2865 


4 


us- 


09- 


854- 


-845-13 


Sequence 


13, Appl 




38 


60.2 


2. 


2 


3105 


4 


us- 


09- 


854- 


•845-5 


Sequence 


5, Appli 




39 


60.2 


2. 


2 


3150 


4 


us- 


09- 


854- 


-845-1 


Sequence 


1, Appli 




40 


60.2 


2. 


2 


3237 


4 


us- 


09- 


854- 


-845-7 


Sequence 


7, Appli 




41 


60.2 


2. 


2 


3282 


4 


us- 


09- 


854- 


•845-3 


Sequence 


3, Appli 




42 


60.2 


2. 


2 


3411 


4 


US- 


09- 


854- 


-845-11 


Sequence 


11, Appl 




43 


60.2 


2. 


2 


3456 


4 


us- 


09- 


854- 


845-9 


Sequence 


9, Appli 




44 


60.2 


2. 


2 


4074 


4 


us- 


09- 


854- 


845-17 


Sequence 


17, Appl 




45 


56.4 


2. 


0 


5178 


4 


us- 


09- 


949- 


016-5241 


Sequence 


5241, Ap 



ALIGNMENTS 



RESULT 1 
US-08-808-982-1 

Sequence 1, Application US/08808982 
Patent No. 5939271 
GENERAL INFORMATION: 

APPLICANT: Tessier-Lavigne, Marc 
APPLICANT: Leonardo, E. David 
APPLICANT: Hink, Lindsay 
APPLICANT: Masu, Masayuki 
APPLICANT: Kazuko, Keino-Masu 
TITLE OF INVENTION: Netrin Receptors 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: SCIENCE & TECHNOLOGY LAW GROUP 
STREET: 268 BUSH STREET, SUITE 3200 
CITY: SAN FRANCISCO 
STATE: CALIFORNIA 
COUNTRY: USA 



ZIP: 94104 
COMPUTER READABLE FORM: • 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/808,982 
; FILING DATE: 

; CLASSIFICATION: 530 

ATTORNEY/ AGENT INFORMATION: 

NAME: OSMAN, RICHARD A 

REGISTRATION NUMBER: 36,627 

REFERENCE/ DOCKET NUMBER: UC96-217 
TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (415) 343-4341 

; TELEFAX: (415) 343-4342 

; INFORMATION FOR SEQ ID NO: 1: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 3014 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
; MOLECULE TYPE: cDNA 
US-08-808-982-1 

Query Match 82.1%; Score 2259; DB 2; Length 3014; 

Best Local Similarity 89.7%; Pred. No. 0; 

Matches 2427; Conservative 0; Mismatches 280; Indels 0; Gaps 0; 
Qy 4 6 

Db 1 
Qy 106 
Db 61 
Qy 166 
Db 121 
Qy 226 
Db 181 
Qy 286 
Db 241 
Qy 346 
Db 301 
Qy 406 
Db 361 



ATGGCCGTCCGGCCCGGCCTGTGGCCAGCGCTCCTGGGCATAGTCCTCGCCGCTTGGCTC 105 

I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCCGTCCGGCCCGGCCTGTGGCCAGTGCTCCTGGGCATAGTCCTCGCCGCCTGGCTT 60 

CGCGGCTCGGGTGCCCAGCAGAGTGCCACCGTGGCCAACCCAGTGCCTGGTGCCAACCCG 165 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGGTTCGGGTGCCCAGCAGAGTGCCACGGTGGCCAATCCAGTGCCCGGTGCCAACCCC 120 

GACCTGCTTCCCCACTTCCTGGTGGAGCCCGAGGATGTGTACATCGTCAAGAACAAGCCA 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC CT GCT GCCC CACTT CCT GGT AGAGCCTGAGGAC GT GTACATT GTCAAGAACAAGCCG 180 

GTGCTGCTTGTGTGCAAGGCCGTGCCCGCCACGCAGATCTTCTTCAAGTGCAACGGGGAG 285 

III II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGTTGTTGGTGTGCAAGGCTGTGCCTGCCACCCAGATCTTCTTCAAGTGCAATGGGGAA 240 

TGGGTGCGCCAGGTGGACCACGTGATCGAGCGCAGCACAGACGGGAGCAGTGGGCTGCCC 345 
I I I I I I I I I I I I I II I I I I I II II I I I I I I I I III I I I I II II I I I I 
T GGGT C C GC CAGGT C GAT CACGT AATT GAAC GCAGC ACC GACAGC AGCAGCGGATT GC CA 300 

ACCATGGAGGTCCGCATTAATGTCTCAAGGCAGCAGGTCGAGAAGGTGTTCGGGCTGGAG 405 
I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
AC CAT GGAGGT C CGT AT CAACGT AT CGAGGC AGCAGGT AGAGAAAGTGTT TGGGCT GGAG 360 

GAAT ACT GGT GC CAGT GCGT GGC AT GGAGCT C CT CGGGC ACCAC CAAGAGT CAGAAGGCC 465 
I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I II II I 
GAAT ACT GGT GC CAGT GT GT GGC AT GGAGCT C CT C GGGT ACCAC CAAAAGT CAGAAGGCC 420 



Qy 466 T ACAT C CGCAT AGC CAGATT GC GCAAGAACTTC GAGCAGGAGC CGCT GGC CAAGGAGGT G 525 

I I I I I I M M Ml I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 
Db 421 T ACAT CCGGATT GC CT AT TT GCGCAAGAACTTT GAGCAGGAGC CACT GGCCAAGGAAGTG 480 

Qy 526 TCCCTGGAGCAGGGCATCGTGCTGCCCTGCCGTCCACCGGAGGGCATCCCTCCAGCCGAG 585 

I I I I I II I I I I I I I I II II II II II II II II II I I I I I I I I I I IN 
Db 481 T CACT GGAGCAAGGCATT GT ACT ACCTT GT CGCC CCC CAGAAGGAAT CC C CCCAGCT GAG 540 

Qy 586 GT GGAGT GGCT C CG GAACGAGGAC CTGGTGGAC C C GTCCCTGGACC CCAAT GT AT AC AT C 64 5 

I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I MINI 
Db 541 GT GGAGT GGCTT CGAAAT GAGGACCTCGT GGACC C CT C CCT CGAT CC CAAT GT GT ACAT C 600 

Qy 646 ACGCGGGAGCACAGCCTGGTGGTGCGACAGGCCCGCCTTGCTGACACGGCCAACTACACC 705 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 601 ACGCGGGAGCAC AGC CT AGT C GT GC GT CAGGC C C GC CT GGCCGACAC GGC CAACT AC ACC 660 

Qy 706 TGCGTGGCCAAGAACATCGTGGCACGTCGCCGCAGCGCCTCCGCTGCTGTCATCGTCTAC 765 

II I I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I II II I I I I I II II 

Db 661 TGTGTGGCCAAGAACATCGTAGCCCGTCGCCGAAGCACCTCTGCAGCGGTCATTGTTTAT 720 

Qy 766 GTGAACGGTGGGTGGTCGACGTGGACCGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGC 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTGAACGGTGGGTGGTCGACGTGGACTGAGTGGTCCGTCTGCAGCGCCAGCTGTGGGCGT 780 

Qy 826 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCGCCTCTCAACGGGGGCGCTTTC 885 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 781 GGCTGGCAGAAACGGAGCCGGAGCTGCACCAACCCGGCACCTCTCAACGGGGGCGCCTTC 840 

Qy 886 TGTGAGGGGCAGAATGT CCAGAAAACAGCCT GCGCCACCCTGTGCCCAGTAGACGGCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 
Db 841 T GTGAGGGGCAGAAT GT CCAGAAAACAGCCTGCGCCACTCTGT GCCCAGTGGATGGGAGC 900 

Qy 94 6 TGGAGCCCGTGGAGCAAGTGGTCGGCCTGTGGGCTGGACTGCACCCACTGGCGGAGCCGT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TGGAGTTCGTGGAGTAAGTGGTCAGCCTGTGGGCTTGACTGCACCCACTGGCGGAGCCGC 960 

Qy 1006 GAGT GCT CT GAC C CAGCACCC C GCAAC GGAGGGGAGGAGT GCCAGGGCACT GAC CT GGAC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 961 GAGT GCT CT GAC C CAGC AC C C CGCAAT GGAGGT GAGGAGT GTCGGGGT GCT GACCT GGAC 1020 

Qy 1066 ACCCGCAACTGTACCAGTGACCTCTGTGTACACAGTGCTTCTGGCCCTGAGGACGTGGCC 1125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCCGCAACTGTACCAGTGACCTCTGCCTGCACACCGCTTCTTGCCCCGAGGACGTGGCT 1080 

Qy 1126 CTCTATGTGGGCCTCATCGCCGTGGCCGTCTGCCTGGTCCTGCTGCTGCTTGTCCTCATC 1185 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCTACATCGGCCTTGTCGCTGTGGCTGTGTGCCTCTTCTTGCTGTTGCTGGCCCTTGGA 1140 

Qy 1186 CTCGTTTATTGCCGGAAGAAGGAGGGGCTGGACTCAGATGTGGCTGACTCGTCCATTCTC 124 5 

I I I I I I I M M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1141 CTCATTTACTGTCGCAAGAAGGAAGGGCTGGACTCCGATGTGGCCGACTCGTCCATCCTC 1200 

Qy 1246 AC CT CAGGCTT C CAGC C CGT C AGCAT CAAGC C C AGCAAAGCAGACAAC CCCCAT CT GCTC 1305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 ACCTCGGGCTTCCAGCCTGTCAGCATCAAGCCCAGCAAAGCAGACAACCCCCACCTGCTC 1260 



Qy 1306 AC CAT C C AGC C GGACCT CAGC ACC AC CACCACCACCTACCAGGGC AGT CTCTGTCCCCGG 1365 

I I I I I I I I I I I I I I I I I II I I I I I 1 I I I I I II I I I I I I I I I I I I I I I I III I II 
Db 1261 AC CAT CC AGCCAGACCTCAGCACCACCACT AC CAC CT AC CAGGGC AGT CT ATGTT CGAGG 1320 

Qy 1366 CAGGATGGGCCCAGCCCCAAGTTCCAGCTCACCAATGGGCACCTGCTCAGCCCCCTGGGT 1425 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1321 CAGGATGGACCCAGCCCCAAGTTCCAGCTCTCTAATGGTCACCTGCTCAGCCCACTGGGG 1380 

Qy 1426 GGC GGCC GCC AC AC ACT GCAC CACAGCT CT CCCAC CT CTGAGGC C GAGGAGTT C GT CT CC 1485 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I 

Db 1381 AGTGGCCGCCATACGTTGCACCACAGCTCACCCACCTCTGAGGCTGAGGACTTCGTCTCC 1440 

Qy 1486 CGCCTCTCCACCCAGAACTACTTCCGCTCCCTGCCCCGAGGCACCAGCAACATGACCTAT 1545 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1441 CGCCTCTCCACCCAAAACTACTTTCGTTCCCTGCCCCGCGGCACCAGCAACATGGCCTAC 1500 

Qy 1546 GGGAC CTT CAACTT CCT CGGGGGC CGGCTGAT GATC C CTAAT ACAGGT AT CAGC CT C CTC 1605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 

Db 1501 GGGACCTTCAACTTCCTCGGGGGCCGGCTGATGATCCCTAATACGGGGATCAGCCTCCTC 1560 

Qy 1606 ATCCCCCCAGATGCCATACCCCGAGGGAAGATCTATGAGATCTACCTCACGCTGCACAAG 1665 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AT AC C CC C GGAT GC C AT CC CC CGAGGAAAGAT CT AC GAGAT CT ACCT C ACACT GC ACAAG 1620 

Qy 1666 C C GGAAGACGT GAGGTT G CC CCT AGCT GGCT GT CAGACCCT GCT GAGT C CCAT CGT T AGC 1725 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 

Db 1621 CC AGAAGAC GT GAGGTT GCC CCT AGCT GGCT GT CAGAC CCT GCT GAGT CCAGT C GT T AGC 1680 

Qy 1726 TGTGGACCCCCTGGCGTCCTGCTCACCCGGCCAGTCATCCTGGCTATGGACCACTGTGGG 1785 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1681 TGTGGGCCCCCAGGAGTCCTGCTCACCCGGCCAGTCATCCTTGCAATGGACCACTGTGGA 1740 

Qy 1786 GAGC CCAGCC CT GACAGCTG GAGC CTGC GC CT CAAAAAGCAGT C GT GC GAGGGCAGCT GG 1845 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I II II I I I I Ml 

Db 1741 GAGCCCAGCCCTGACAGCTGGAGTCTGCGCCTCAAAAAGCAGTCCTGCGAGGGCAGTTGG 1800 

Qy 1846 GAGGATGTGCTGCACCTGGGCGAGGAGGCGCCCTCCCACCTCTACTACTGCCAGCTGGAG 1905 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I II II I I 

Db 1801 GAGGATGT GCT GCAC CTT GGT GAGGAGT CAC CT T C CCACCT CT ACT ACTGC CAGCT GGAG 1860 

Qy 1906 GCCAGTGCCTGCTACGTCTTCACCGAGCAGCTGGGCCGCTTTGCCCTGGTGGGAGAGGCC 1965 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I II 

Db 1861 GCCGGGGCCTGCTATGTCTTCACGGAGCAGCTGGGCCGCTTTGCCCTGGTAGGAGAGGCC 1920 

Qy 1966 CTCAGCGTGGCTGCCGCCAAGCGCCTCAAGCTGCTTCTGTTTGCGCCGGTGGCCTGCACC 2025 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I II I I I I I I I I II I I I I I I I I II 

Db 1921 CTCAGCGTGGCTGCCACCAAGCGCCTCAGGCTCCTTCTGTTTGCTCCCGTGGCCTGTACG 1980 

Qy 2026 T C CCT C GAGT ACAAC AT C CGGGT CT ACT GC CT GCAT GACAC CCACGAT GCACT CAAGGAG 2085 

I I I I I II I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I II I I I I I I I I I 

Db 1981 TCCCTTGAGTACAACATCCGAGTGTACT GCCTACACGACAC CCACGACGCT CT CAAGGAG 204 0 

Qy 2086 GTGGTGCAGCTGGAGAAGCAGCTGGGGGGACAGCTGATCCAGGAGCCACGGGT CCT GCAC 2145 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2041 GT GGT GC AGCT GGAGAAGCAGCT AGGT GGACAGCT GAT CCAGGAGCCT C GCGT CCTGC AC 2100 

Qy 2146 TTCAAGGACAGTTACCACAACCTGCGCCTATCCATCCACGATGTGCCCAGCTCCCTGTGG 2205 



